Почему RandomizedSearchCV иногда возвращает худшие результаты, чем ручная настройка в scikit-learn?Python

Программы на Python
Ответить
Anonymous
 Почему RandomizedSearchCV иногда возвращает худшие результаты, чем ручная настройка в scikit-learn?

Сообщение Anonymous »

Я работаю над проблемой классификации, используя RandomForestClassifier scikit-learn. Я пробовал использовать RandomizedSearchCV для настройки гиперпараметров, но результаты были хуже, чем когда я вручную устанавливал параметры, основываясь на интуиции и методе проб и ошибок.
Вот упрощенная версия моего кода:

Код: Выделить всё

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RandomizedSearchCV

param_dist = {
"n_estimators": [100, 200, 300],
"max_depth": [None, 10, 20, 30],
"min_samples_split": [2, 5, 10],
"min_samples_leaf": [1, 2, 4],
}

clf = RandomForestClassifier(random_state=42)
random_search = RandomizedSearchCV(clf, param_distributions=param_dist, n_iter=10, cv=5, scoring='accuracy')
random_search.fit(X_train, y_train)
При нескольких запусках этот подход дает модели с более низкой точностью на моем тестовом наборе, чем моя модель, настроенная вручную.
Каковы распространенные ошибки при использовании RandomizedSearchCV?
Как я могу обеспечить воспроизводимость и надежность процесса настройки?>

Подробнее здесь: https://stackoverflow.com/questions/796 ... -tuning-in
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»