В чем разница между bst.best_score, bst.best_iteration и bst.best_ntree_limit в XGBoost? - Цифровое Кемерово

В чем разница между bst.best_score, bst.best_iteration и bst.best_ntree_limit в XGBoost? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

В чем разница между bst.best_score, bst.best_iteration и bst.best_ntree_limit в XGBoost?

Цитата

Сообщение Anonymous » 03 ноя 2025, 20:46

Когда я использую xgboost для обучения данных для задачи классификации по двум категориям, я хотел бы использовать раннюю остановку, чтобы получить лучшую модель, но я не понимаю, какую из них использовать в своем прогнозе, поскольку ранняя остановка вернет 3 разных варианта.
Например, следует ли мне использовать

Код: Выделить всё

preds = model.predict(xgtest, ntree_limit=bst.best_iteration)

или мне следует использовать

Код: Выделить всё

preds = model.predict(xgtest, ntree_limit=bst.best_ntree_limit)

или оба правы, и их следует применять к разным обстоятельствам? Если да, то как я могу решить, какой из них использовать?
Вот исходная цитата из документа xgboost, но в ней не указана причина, и я также не нашел сравнения между этими параметрами:

Ранняя остановка
Если у вас есть набор проверки, вы можете использовать раннюю остановку, чтобы найти
оптимальное количество раундов повышения. Для ранней остановки требуется как минимум
один набор значений eval. Если их несколько, будет использоваться последний.
train(..., evals=evals, Early_stopping_rounds=10)
Модель будет тренироваться до тех пор, пока показатель проверки не перестанет улучшаться.
Чтобы продолжить обучение, ошибка проверки должна уменьшаться по крайней мере каждые
early_stopping_rounds.
Если произойдет ранняя остановка, у модели будет три дополнительных поля:
bst.best_score, bst.best_iteration и bst.best_ntree_limit. Обратите внимание, что
train() вернет модель последней итерации, а не самую лучшую.
Pr
ediction
Обученная или загруженная модель может выполнять прогнозы на
наборах данных.

Код: Выделить всё

# 7 entities, each contains 10 features
data = np.random.rand(7, 10)
dtest = xgb.DMatrix(data)
ypred = bst.predict(dtest)

Если во время обучения включена ранняя остановка
, вы можете получить прогнозы для лучшей
итерации с помощью bst.best_ntree_limit:

Код: Выделить всё

ypred = bst.predict(dtest,ntree_limit=bst.best_ntree_limit)

Подробнее здесь: https://stackoverflow.com/questions/435 ... t-best-ntr

1762192011

Anonymous

Когда я использую xgboost для обучения данных для задачи классификации по двум категориям, я хотел бы использовать раннюю остановку, чтобы получить лучшую модель, но я не понимаю, какую из них использовать в своем прогнозе, поскольку ранняя остановка вернет 3 разных варианта.
Например, следует ли мне использовать
[code]preds = model.predict(xgtest, ntree_limit=bst.best_iteration)
[/code]
или мне следует использовать
[code]preds = model.predict(xgtest, ntree_limit=bst.best_ntree_limit)
[/code]
или оба правы, и их следует применять к разным обстоятельствам? Если да, то как я могу решить, какой из них использовать?
Вот исходная цитата из документа xgboost, но в ней не указана причина, и я также не нашел сравнения между этими параметрами:

Ранняя остановка
Если у вас есть набор проверки, вы можете использовать раннюю остановку, чтобы найти
оптимальное количество раундов повышения. Для ранней остановки требуется как минимум
один набор значений eval. Если их несколько, будет использоваться последний.
train(..., evals=evals, Early_stopping_rounds=10)
Модель будет тренироваться до тех пор, пока показатель проверки не перестанет улучшаться.
Чтобы продолжить обучение, ошибка проверки должна уменьшаться по крайней мере каждые
early_stopping_rounds.
Если произойдет ранняя остановка, у модели будет три дополнительных поля:
bst.best_score, bst.best_iteration и bst.best_ntree_limit. Обратите внимание, что
train() вернет модель последней итерации, а не самую лучшую.
Pr
ediction
Обученная или загруженная модель может выполнять прогнозы на
наборах данных.
[code]# 7 entities, each contains 10 features
data = np.random.rand(7, 10)
dtest = xgb.DMatrix(data)
ypred = bst.predict(dtest)
[/code]
Если во время обучения включена ранняя остановка
, вы можете получить прогнозы для лучшей
итерации с помощью bst.best_ntree_limit:
[code]ypred = bst.predict(dtest,ntree_limit=bst.best_ntree_limit)[/code]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/43534219/what-is-the-difference-among-bst-best-score-bst-best-iteration-and-bst-best-ntr[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»