Использование MLFLOW.Evaluate Best Practice для оценки модели в данных DataBricks? - Цифровое Кемерово

Использование MLFLOW.Evaluate Best Practice для оценки модели в данных DataBricks? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Использование MLFLOW.Evaluate Best Practice для оценки модели в данных DataBricks?

Цитата

Сообщение Anonymous » 08 авг 2025, 15:04

Я пытаюсь оценить эффективность модели случайной регрессии леса в данных Databricks. Я знаком с Scikit-Learn, но новичок в DataBricks и Mlflow, поэтому я не уверен, что я делаю это лучше всего. Я буду опираться на это в будущем, регистрируя артефакты для таких вещей, как импорт функций. < /P>
with mlflow.start_run() as run:

#Train the model
model = RandomForestRegressor(random_state = 1)
model.fit(X = x_train, y = y_train)

#Use the model to make some test predictions
train_prediction = model.predict(X = x_train)
test_prediction = model.predict(X = x_test)

#Calculate metrics
test_mae = mean_absolute_error(y_true = y_test, y_pred = test_prediction)
test_mse = mean_squared_error(y_true = y_test, y_pred = test_prediction)
test_r2 = r2_score(y_true = y_test, y_pred = test_prediction)
test_rmse = np.sqrt(test_mse)

#Log metrics to the current run
mlflow.log_metrics({"test_mae": test_mae, "test_mse": test_mse, "test_r2": test_r2, "test_rmse": test_rmse})

#Log the model to the current run
signature = infer_signature(x_train, train_prediction)
mlflow.sklearn.log_model(sk_model = model, artifact_path = "my_model", signature = signature)
< /code>
Это работает нормально. Тем не менее, все документы Mlflow, которые я видел, делают вещи по -другому, больше похоже на это: < /p>
#Train the model
model = RandomForestRegressor(random_state = 1)
model.fit(X = x_train, y = y_train)

#Infer the model's signature
train_prediction = model.predict(X = x_train)
signature = infer_signature(x_train, train_prediction)

#Construct evaluation dataset
evaluation_df = x_test
evaluation_df["target"] = y_test

#Log the model
with mlflow.start_run() as run:
model_info = mlflow.sklearn.log_model(sk_model = model, artifact_path = "my_model", signature = signature)
result = mlflow.evaluate(
model_info.model_uri,
evaluation_df,
targets = "target",
model_type = "regressor",
evaluators = ["default"],
)
< /code>
Я не понимаю, прочитав документы, какие преимущества это дает. Я пропускаю, не используя mlflow.evaluate? Или оба метода одинаково достоверные способы получить одинаковый результат?
Любой совет высоко ценится!

Подробнее здесь: https://stackoverflow.com/questions/797 ... databricks

Реклама

1754654670

Anonymous

 Я пытаюсь оценить эффективность модели случайной регрессии леса в данных Databricks. Я знаком с Scikit-Learn, но новичок в DataBricks и Mlflow, поэтому я не уверен, что я делаю это лучше всего. Я буду опираться на это в будущем, регистрируя артефакты для таких вещей, как импорт функций. < /P>
with mlflow.start_run() as run:

#Train the model
model = RandomForestRegressor(random_state = 1)
model.fit(X = x_train, y = y_train)

#Use the model to make some test predictions
train_prediction = model.predict(X = x_train)
test_prediction = model.predict(X = x_test)

#Calculate metrics
test_mae = mean_absolute_error(y_true = y_test, y_pred = test_prediction)
test_mse = mean_squared_error(y_true = y_test, y_pred = test_prediction)
test_r2 = r2_score(y_true = y_test, y_pred = test_prediction)
test_rmse = np.sqrt(test_mse)

#Log metrics to the current run
mlflow.log_metrics({"test_mae": test_mae, "test_mse": test_mse, "test_r2": test_r2, "test_rmse": test_rmse})

#Log the model to the current run
signature = infer_signature(x_train, train_prediction)
mlflow.sklearn.log_model(sk_model = model, artifact_path = "my_model", signature = signature)
< /code>
Это работает нормально. Тем не менее, все документы Mlflow, которые я видел, делают вещи по -другому, больше похоже на это: < /p>
#Train the model
model = RandomForestRegressor(random_state = 1)
model.fit(X = x_train, y = y_train)

#Infer the model's signature
train_prediction = model.predict(X = x_train)
signature = infer_signature(x_train, train_prediction)

#Construct evaluation dataset
evaluation_df = x_test
evaluation_df["target"] = y_test

#Log the model
with mlflow.start_run() as run:
model_info = mlflow.sklearn.log_model(sk_model = model, artifact_path = "my_model", signature = signature)
result = mlflow.evaluate(
model_info.model_uri,
evaluation_df,
targets = "target",
model_type = "regressor",
evaluators = ["default"],
)
< /code>
Я не понимаю, прочитав документы, какие преимущества это дает. Я пропускаю, не используя mlflow.evaluate? Или оба метода одинаково достоверные способы получить одинаковый результат? 
Любой совет высоко ценится!  

Подробнее здесь: [url]https://stackoverflow.com/questions/79729737/is-using-mlflow-evaluate-best-practice-for-model-assessment-in-databricks[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Использование MLFLOW.Evaluate Best Practice для оценки модели в данных DataBricks?

Последнее сообщение Anonymous « 09 авг 2025, 00:33
Добавлено в форуме Python

Anonymous » 09 авг 2025, 00:33 » в форуме Python

Я пытаюсь оценить производительность модели случайной регрессии леса в данных DataBricks. Я буду опираться на это в будущем, регистрируя артефакты для таких вещей, как импорт функций.
with mlflow.start_run() as run:

#Train the model
model =...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
09 авг 2025, 00:33
Использование MLFLOW.Evaluate Best Practice для оценки модели в данных DataBricks?

Последнее сообщение Anonymous « 09 авг 2025, 12:39
Добавлено в форуме Python

Anonymous » 09 авг 2025, 12:39 » в форуме Python

Я пытаюсь оценить производительность модели случайной регрессии леса в данных DataBricks. Я буду опираться на это в будущем, регистрируя артефакты для таких вещей, как импорт функций.
with mlflow.start_run() as run:

#Train the model
model =...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
09 авг 2025, 12:39
Best Practice Springs Kafka Consumer: какое сообщение должен получить потребитель

Последнее сообщение Anonymous « 24 июл 2024, 14:44
Добавлено в форуме JAVA

Anonymous » 24 июл 2024, 14:44 » в форуме JAVA

Мне нужно начать работать с Kafka. Мне трудно понять, что должен получить Потребитель:
Насколько я понимаю, мы можем настроить потребителя несколькими способами:
пример 1:
@KafkaListener(topics = topic_name)
public void receiveSimpleString(@Payload...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
24 июл 2024, 14:44
Java Best Practice Testing с Junit

Последнее сообщение Anonymous « 11 фев 2025, 06:40
Добавлено в форуме JAVA

Anonymous » 11 фев 2025, 06:40 » в форуме JAVA

Я в настоящее время использую следующий метод и модульный тест для метода. Я думаю, что тест может/должен быть разбит на большее количество тестов, но я не уверен, сколько тестов написать для этого или каковы более важные части особенно...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
11 фев 2025, 06:40
Ошибка MlFlow Databricks: истекло время ожидания при оценке модели. Убедитесь, что модель оценивается в течение тайм-аут

Последнее сообщение Anonymous « 29 фев 2024, 18:44
Добавлено в форуме Python

Anonymous » 29 фев 2024, 18:44 » в форуме Python

Я использую блоки данных и mlflow для создания модели, а затем регистрирую ее в качестве конечной точки обслуживания. Иногда запуск моделей занимает более 2 минут, и через 2 минуты выдается ошибка тайм-аута:

При оценке модели истекло время...

0 Ответы

92 Просмотры

Последнее сообщение Anonymous
29 фев 2024, 18:44

Вернуться в «Python»

Programmiererforum