Лучший способ получить записи из mlflow.genai..datasets.EvaluationDatasetPython

Программы на Python
Ответить
Anonymous
 Лучший способ получить записи из mlflow.genai..datasets.EvaluationDataset

Сообщение Anonymous »

В mlflow функция mlflow.genai.datasets.search_datasets возвращает объекты типа mlflow.genai.datasets.EvaluationDataset, который представляет собой конструкцию, которая пытается абстрагироваться от наборов данных mlflow и блоков данных. Однако из-за этого кода в классе неудобно получать записи (или даже количество записей) из набора данных

Код: Выделить всё

def __getattr__(self, name):
"""
Dynamic attribute delegation for simple pass-through properties.

This handles attributes that don't require special logic and can be
directly delegated to the underlying dataset implementation.
"""
if name.startswith("_") or name == "records":
raise AttributeError(f"'{type(self).__name__}' object has no attribute '{name}'")
что не позволяет вам выполнять dataset.records. Я нашел два потенциальных обходных пути, но не уверен, есть ли более чистый/более эффективный способ сделать это?
Обходной путь 1:
Я знаю, что у меня есть наборы данных mlflow (не databricks), поэтому вместо этого можно использовать dataset._mlflow_dataset.records.
Обходной путь 2:
Пройдите через to_dict, который работает с общедоступными API, но добавляет ненужное преобразование в простой словарь

Код: Выделить всё

ds_dict = dataset.to_dict()
records = ds_dict['records']
Есть ли какой-нибудь ожидаемый/стандартный способ сделать это?

Подробнее здесь: https://stackoverflow.com/questions/798 ... iondataset
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»