Почему мой randomforestclassifier переполняет, несмотря на то, что использует перекрестную проверку?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Почему мой randomforestclassifier переполняет, несмотря на то, что использует перекрестную проверку?

Сообщение Anonymous »

Я работаю над проблемой бинарной классификации, используя randomforestclassifier из Scikit-Learn. Мой набор данных имеет ~ 10000 строк и ~ 20 численных функций. Я использовал train_test_split и cross_val_score, но моя модель очень хорошо работает в учебных данных и плохо в тестовом наборе.
Вот мой код: < /p>
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.metrics import classification_report

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_train, y_train)

# Cross-validation
cv_scores = cross_val_score(clf, X_train, y_train, cv=5)
print("Cross-validation scores:", cv_scores)

# Evaluation on test set
y_pred = clf.predict(X_test)
print(classification_report(y_test, y_pred))
< /code>
Наблюдаемый вывод: < /p>
Точность CV: ~ 95%< /p>
Точность теста: ~ 80%< /p>
Даже при перекрестной проверке, моя точность теста значительно падает, предполагая переосмысление. (max_depth) < /p>
Настройка max_features для 'sqrt' < /p>
Использование min_samples_leaf = 5 < /p>
Каковы общие причины, по которым случайно-карболс-класс может все еще переоценить, даже если оценки перекрестной проверки высоки? Есть ли лучший способ подтвердить обобщение модели за пределами cross_val_score?

Подробнее здесь: https://stackoverflow.com/questions/795 ... validation
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»