Почему RandomizedSearchCV иногда возвращает худшие результаты, чем ручная настройка в scikit-learn? - Цифровое Кемерово

Почему RandomizedSearchCV иногда возвращает худшие результаты, чем ручная настройка в scikit-learn? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Почему RandomizedSearchCV иногда возвращает худшие результаты, чем ручная настройка в scikit-learn?

Цитата

Сообщение Anonymous » 16 ноя 2025, 01:59

Я работаю над проблемой классификации, используя RandomForestClassifier scikit-learn. Я пробовал использовать RandomizedSearchCV для настройки гиперпараметров, но результаты были хуже, чем когда я вручную устанавливал параметры, основываясь на интуиции и методе проб и ошибок.
Вот упрощенная версия моего кода:

Код: Выделить всё

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RandomizedSearchCV

param_dist = {
"n_estimators": [100, 200, 300],
"max_depth": [None, 10, 20, 30],
"min_samples_split": [2, 5, 10],
"min_samples_leaf": [1, 2, 4],
}

clf = RandomForestClassifier(random_state=42)
random_search = RandomizedSearchCV(clf, param_distributions=param_dist, n_iter=10, cv=5, scoring='accuracy')
random_search.fit(X_train, y_train)

При нескольких запусках этот подход дает модели с более низкой точностью на моем тестовом наборе, чем моя модель, настроенная вручную.
Каковы распространенные ошибки при использовании RandomizedSearchCV?
Как я могу обеспечить воспроизводимость и надежность процесса настройки?>

Подробнее здесь: https://stackoverflow.com/questions/796 ... -tuning-in

1763247595

Anonymous

Я работаю над проблемой классификации, используя RandomForestClassifier scikit-learn. Я пробовал использовать RandomizedSearchCV для настройки гиперпараметров, но результаты были хуже, чем когда я вручную устанавливал параметры, основываясь на интуиции и методе проб и ошибок.
Вот упрощенная версия моего кода:
[code]from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RandomizedSearchCV

param_dist = {
"n_estimators": [100, 200, 300],
"max_depth": [None, 10, 20, 30],
"min_samples_split": [2, 5, 10],
"min_samples_leaf": [1, 2, 4],
}

clf = RandomForestClassifier(random_state=42)
random_search = RandomizedSearchCV(clf, param_distributions=param_dist, n_iter=10, cv=5, scoring='accuracy')
random_search.fit(X_train, y_train)
[/code]
При нескольких запусках этот подход дает модели с более низкой точностью на моем тестовом наборе, чем моя модель, настроенная вручную.
Каковы распространенные ошибки при использовании RandomizedSearchCV?
Как я могу обеспечить воспроизводимость и надежность процесса настройки?> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79603404/why-does-randomizedsearchcv-sometimes-return-worse-results-than-manual-tuning-in[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»