Sklearn Pipelines + GridsearchCV + XGBoost + Кривая обучения

Sklearn Pipelines + GridsearchCV + XGBoost + Кривая обучения ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Sklearn Pipelines + GridsearchCV + XGBoost + Кривая обучения

Цитата

Сообщение Anonymous » 29 июл 2024, 16:42

Я новичок в sklearn и XGBoost.
Я хотел бы использовать GridSearchCV для настройки классификатора XGBoost. Одна из проверок, которую я хотел бы провести, — это графический анализ потерь при обучении и тестировании. На данный момент я создал следующий код:

Код: Выделить всё

# Create a new instance of the classifier
xgbr =  xgb.XGBClassifier()
# Create a new pipeline with preprocessing steps and model (imballanced learn)
pipeline  = imb_pipeline([
('preprocess', preprocess), # Encode and transform categorical variables
('re-sample', samplers[0]), # re-samples data to ballanced state
('scale', scalers[0]), # scales the data
('model', xgbr), # models
])

# Create parameter values for gridsearch - carefull, "model__" prepended defined in pipeline
params = {
'model__max_depth': [3, 4, 5, 6, 8, 10, 12, 15],
'model__learning_rate': [0.001, 0.01, 0.1, 0.20, 0.25, 0.30],
"model__gamma":[0, 0.25, 0.5, 0.75,1],
'model__n_estimators': [100, 500, 1000],
"model__subsample":[0.9],
"model__colsample_bytree":[0.5],
"model__early_stopping_rounds": [10],
"model__random_state": [random_state],
"model__eval_metric" : ["error"],
"model__eval_set" : [[(X_train, Y_train), (X_test,Y_test)]]
}

# Use GridSearchCV for all combinations
grid = GridSearchCV(
estimator = pipeline,
param_grid = params,
scoring = 'roc_auc',
n_jobs = -1,
cv = 5,
verbose = 3,
)

# Model fitting
grid.fit(X_train, Y_train)

Я создал в параметрах пару ключ-значение для eval_metric и eval_set:

Мой вопрос сейчас , как получить доступ к этим значениям и построить кривую потерь при обучении и тестах (извините, я не могу опубликовать здесь цифру).
Еще один вопрос: передача значений с помощью eval_set также передается по конвейеру или нужно ли мне создавать для них отдельный конвейер?
Я использую xgb.__version == 0.90, sklearn.__version__ == 1.0.2, python == 3.7.13 @ (Google Colab)

Подробнее здесь: https://stackoverflow.com/questions/719 ... ning-curve

1722260530

Anonymous

Я новичок в sklearn и XGBoost.
Я хотел бы использовать GridSearchCV для настройки классификатора XGBoost. Одна из проверок, которую я хотел бы провести, — это графический анализ потерь при обучении и тестировании. На данный момент я создал следующий код:
[code]# Create a new instance of the classifier
xgbr =  xgb.XGBClassifier()
# Create a new pipeline with preprocessing steps and model (imballanced learn)
pipeline  = imb_pipeline([
('preprocess', preprocess), # Encode and transform categorical variables
('re-sample', samplers[0]), # re-samples data to ballanced state
('scale', scalers[0]), # scales the data
('model', xgbr), # models
])

# Create parameter values for gridsearch - carefull, "model__" prepended defined in pipeline
params = {
'model__max_depth': [3, 4, 5, 6, 8, 10, 12, 15],
'model__learning_rate': [0.001, 0.01, 0.1, 0.20, 0.25, 0.30],
"model__gamma":[0, 0.25, 0.5, 0.75,1],
'model__n_estimators': [100, 500, 1000],
"model__subsample":[0.9],
"model__colsample_bytree":[0.5],
"model__early_stopping_rounds": [10],
"model__random_state": [random_state],
"model__eval_metric" : ["error"],
"model__eval_set" : [[(X_train, Y_train), (X_test,Y_test)]]
}

# Use GridSearchCV for all combinations
grid = GridSearchCV(
estimator = pipeline,
param_grid = params,
scoring = 'roc_auc',
n_jobs = -1,
cv = 5,
verbose = 3,
)

# Model fitting
grid.fit(X_train, Y_train)
[/code]
Я создал в параметрах пару ключ-значение для eval_metric и eval_set:

Мой вопрос сейчас , как получить доступ к этим значениям и построить кривую потерь при обучении и тестах (извините, я не могу опубликовать здесь цифру).
Еще один вопрос: передача значений с помощью eval_set также передается по конвейеру или нужно ли мне создавать для них отдельный конвейер?
Я использую xgb.__version == 0.90, sklearn.__version__ == 1.0.2, python == 3.7.13 @ (Google Colab) 

Подробнее здесь: [url]https://stackoverflow.com/questions/71955753/sklearn-pipelines-gridsearchcv-xgboost-learning-curve[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 01:49
Добавлено в форуме Python

Anonymous » 02 дек 2024, 01:49 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

54 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 01:49
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 13:06
Добавлено в форуме Python

Anonymous » 02 дек 2024, 13:06 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

55 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 13:06
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 07 дек 2024, 02:51
Добавлено в форуме Python

Anonymous » 07 дек 2024, 02:51 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

43 Просмотры

Последнее сообщение Anonymous
07 дек 2024, 02:51
Оценка в GridSearchCV для XGBoost

Последнее сообщение Anonymous « 25 июл 2024, 13:06
Добавлено в форуме Python

Anonymous » 25 июл 2024, 13:06 » в форуме Python

Сейчас я впервые пытаюсь проанализировать данные с помощью XGBoost. Я хочу найти лучшие параметры с помощью GridsearchCV. Я хочу минимизировать среднеквадратическую ошибку, и для этого я использовал «rmse» в качестве eval_metric. Однако при подсчете...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
25 июл 2024, 13:06
Оценка в GridSearchCV для XGBoost

Последнее сообщение Anonymous « 24 ноя 2024, 23:00
Добавлено в форуме Python

Anonymous » 24 ноя 2024, 23:00 » в форуме Python

Сейчас я впервые пытаюсь проанализировать данные с помощью XGBoost. Я хочу найти лучшие параметры с помощью GridsearchCV. Я хочу минимизировать среднеквадратическую ошибку, и для этого я использовал «rmse» в качестве eval_metric. Однако при подсчете...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
24 ноя 2024, 23:00

Вернуться в «Python»