GridSearchCV Настройка случайного лесного регрессора Лучшие параметры

GridSearchCV Настройка случайного лесного регрессора Лучшие параметры ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

GridSearchCV Настройка случайного лесного регрессора Лучшие параметры

Цитата

Сообщение Anonymous » 01 дек 2024, 00:00

Я хочу улучшить параметры этого GridSearchCV для регрессора случайного леса.

Код: Выделить всё

def Grid_Search_CV_RFR(X_train, y_train):
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import ShuffleSplit
from sklearn.ensemble import RandomForestRegressor

estimator = RandomForestRegressor()
param_grid = {
"n_estimators"      : [10,20,30],
"max_features"      : ["auto", "sqrt", "log2"],
"min_samples_split" : [2,4,8],
"bootstrap": [True, False],
}

grid = GridSearchCV(estimator, param_grid, n_jobs=-1, cv=5)

grid.fit(X_train, y_train)

return grid.best_score_ , grid.best_params_

def RFR(X_train, X_test, y_train, y_test, best_params):
from sklearn.ensemble import RandomForestRegressor
estimator = RandomForestRegressor(n_jobs=-1).set_params(**best_params)
estimator.fit(X_train,y_train)
y_predict = estimator.predict(X_test)
print "R2 score:",r2(y_test,y_predict)
return y_test,y_predict

def splitter_v2(tab,y_indicator):
from sklearn.model_selection import train_test_split
# Asignamos X e y, eliminando la columna y en X
X = correlacion(tab,y_indicator)
y = tab[:,y_indicator]
# Separamos Train y Test respectivamente para X e y
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
return X_train, X_test, y_train, y_test

Я использовал эту функцию 5 раз с этим кодом:

Код: Выделить всё

for i in range(5):
print "Loop: " , i
print "--------------"
X_train, X_test, y_train, y_test = splitter_v2(tabla,1)
best_score, best_params = Grid_Search_CV_RFR(X_train, y_train)
y_test , y_predict = RFR(X_train, X_test, y_train, y_test, best_params)
print "Best Score:" ,best_score
print "Best params:",best_params

Вот результаты:

Код: Выделить всё

Loop:  0
--------------
R2 score: 0.900071279487
Best Score: 0.61802821072
Best params: {'max_features': 'log2', 'min_samples_split': 2, 'bootstrap': False, 'n_estimators': 10}
Loop:  1
--------------
R2 score: 0.993462885564
Best Score: 0.671309726329
Best params: {'max_features': 'log2', 'min_samples_split': 4, 'bootstrap': False, 'n_estimators': 10}
Loop:  2
--------------
R2 score: -0.181378339338
Best Score: -30.9012120698
Best params: {'max_features': 'log2', 'min_samples_split': 4, 'bootstrap': True, 'n_estimators': 20}
Loop:  3
--------------
R2 score: 0.750116663033
Best Score: 0.71472985391
Best params: {'max_features': 'log2', 'min_samples_split': 4, 'bootstrap': False, 'n_estimators': 30}
Loop:  4
--------------
R2 score: 0.692075744759
Best Score: 0.715012972471
Best params: {'max_features': 'sqrt', 'min_samples_split': 2, 'bootstrap': True, 'n_estimators': 30}

¿Почему я получаю разные результаты в оценке R2?, ¿Это потому, что я выбираю CV=5?, ¿Это потому, что я не определил random_state=0 в своем RandomForestRegressor() ?

Подробнее здесь: https://stackoverflow.com/questions/435 ... est-params

1733000455

Anonymous

Я хочу улучшить параметры этого [b]GridSearchCV[/b] для [b]регрессора случайного леса[/b].

[code]def Grid_Search_CV_RFR(X_train, y_train):
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import ShuffleSplit
from sklearn.ensemble import RandomForestRegressor

estimator = RandomForestRegressor()
param_grid = {
"n_estimators"      : [10,20,30],
"max_features"      : ["auto", "sqrt", "log2"],
"min_samples_split" : [2,4,8],
"bootstrap": [True, False],
}

grid = GridSearchCV(estimator, param_grid, n_jobs=-1, cv=5)

grid.fit(X_train, y_train)

return grid.best_score_ , grid.best_params_

def RFR(X_train, X_test, y_train, y_test, best_params):
from sklearn.ensemble import RandomForestRegressor
estimator = RandomForestRegressor(n_jobs=-1).set_params(**best_params)
estimator.fit(X_train,y_train)
y_predict = estimator.predict(X_test)
print "R2 score:",r2(y_test,y_predict)
return y_test,y_predict

def splitter_v2(tab,y_indicator):
from sklearn.model_selection import train_test_split
# Asignamos X e y, eliminando la columna y en X
X = correlacion(tab,y_indicator)
y = tab[:,y_indicator]
# Separamos Train y Test respectivamente para X e y
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
return X_train, X_test, y_train, y_test
[/code]

Я использовал эту [b]функцию[/b] 5 раз с этим кодом:

[code]for i in range(5):
print "Loop: " , i
print "--------------"
X_train, X_test, y_train, y_test = splitter_v2(tabla,1)
best_score, best_params = Grid_Search_CV_RFR(X_train, y_train)
y_test , y_predict = RFR(X_train, X_test, y_train, y_test, best_params)
print "Best Score:" ,best_score
print "Best params:",best_params
[/code]

Вот [b]результаты[/b]:

[code]Loop:  0
--------------
R2 score: 0.900071279487
Best Score: 0.61802821072
Best params: {'max_features': 'log2', 'min_samples_split': 2, 'bootstrap': False, 'n_estimators': 10}
Loop:  1
--------------
R2 score: 0.993462885564
Best Score: 0.671309726329
Best params: {'max_features': 'log2', 'min_samples_split': 4, 'bootstrap': False, 'n_estimators': 10}
Loop:  2
--------------
R2 score: -0.181378339338
Best Score: -30.9012120698
Best params: {'max_features': 'log2', 'min_samples_split': 4, 'bootstrap': True, 'n_estimators': 20}
Loop:  3
--------------
R2 score: 0.750116663033
Best Score: 0.71472985391
Best params: {'max_features': 'log2', 'min_samples_split': 4, 'bootstrap': False, 'n_estimators': 30}
Loop:  4
--------------
R2 score: 0.692075744759
Best Score: 0.715012972471
Best params: {'max_features': 'sqrt', 'min_samples_split': 2, 'bootstrap': True, 'n_estimators': 30}
[/code]

¿Почему я получаю [b]разные результаты[/b] в [b]оценке R2[/b]?, ¿Это потому, что я выбираю [b] CV=5[/b]?, ¿Это потому, что я не определил [b]random_state=0[/b] в своем [b]RandomForestRegressor()[/b] ? 

Подробнее здесь: [url]https://stackoverflow.com/questions/43590489/gridsearchcv-random-forest-regressor-tuning-best-params[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

GridSearchCV Настройка случайного лесного регрессора Лучшие параметры

Последнее сообщение Anonymous « 31 июл 2024, 13:03
Добавлено в форуме Python

Anonymous » 31 июл 2024, 13:03 » в форуме Python

Я хочу улучшить параметры этого GridSearchCV для регрессора случайного леса .

def Grid_Search_CV_RFR(X_train, y_train):
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import ShuffleSplit
from sklearn.ensemble import...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
31 июл 2024, 13:03
Я продолжаю сталкиваться с этой проблемой при обучении регрессора случайного леса.

Последнее сообщение Anonymous « 26 июл 2024, 01:17
Добавлено в форуме Python

Anonymous » 26 июл 2024, 01:17 » в форуме Python

/usr/local/lib/python3.10/dist-packages/sklearn/base.py:432: UserWarning: X имеет имена функций, но RandomForestRegressor был установлен без имен функций
warnings.warn(
Я попробовал добавить значения .values, но все равно выдает ошибку.

Подробнее...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
26 июл 2024, 01:17
Низкая точность от геопространственного случайного лесного моделирования.

Последнее сообщение Anonymous « 23 апр 2025, 12:14
Добавлено в форуме Python

Anonymous » 23 апр 2025, 12:14 » в форуме Python

Я делаю геопространственную оценку, интегрированную с моделированием ML. Проблема заключается в очень низком проценте точности, так как увеличивается больше тренировочных функций, она становится ниже. Каким может быть решение такой проблемы?
код:...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
23 апр 2025, 12:14
Как повысить точность случайного лесного классификатора?

Последнее сообщение Anonymous « 17 июл 2025, 15:49
Добавлено в форуме Python

Anonymous » 17 июл 2025, 15:49 » в форуме Python

У меня есть лесной классификатор. Его точность составляет около 61%. Я хочу попытаться повысить точность, но то, что я уже пытался, не увеличивает ее значительно. Код показан ниже:
# importing time module to record the time of running the program...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
17 июл 2025, 15:49
Дерево решений Модель регрессора получает значение max_eep модели с высочайшей точностью.

Последнее сообщение Anonymous « 21 окт 2024, 14:25
Добавлено в форуме Python

Anonymous » 21 окт 2024, 14:25 » в форуме Python

Постройте модель регрессора дерева решений из набора X_train и меток Y_train с параметрами по умолчанию. Назовите модель dt_reg.
Оцените точность модели на наборе обучающих данных и распечатайте ее оценку.
Оцените точность модели на тестовых данных...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
21 окт 2024, 14:25

Вернуться в «Python»