Код: Выделить всё
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
scores =[]
for k in range(1, 200):
rfc = RandomForestClassifier(n_estimators=k)
rfc.fit(x_train, y_train)
y_pred = rfc.predict(x_test)
scores.append(accuracy_score(y_test, y_pred))
import matplotlib.pyplot as plt
%matplotlib inline
# plot the relationship between K and testing accuracy
# plt.plot(x_axis, y_axis)
plt.plot(range(1, 200), scores)
plt.xlabel('Value of n_estimators for Random Forest Classifier')
plt.ylabel('Testing Accuracy')

Здесь видно, что высокое значение для n_estimators даст хороший показатель точности, но оно колеблется случайным образом на кривой даже для близких значений n_estimators, поэтому я не могу выбрать лучший точно. Я только хочу знать о настройке гиперпараметра n_estimators, как мне его выбрать, пожалуйста, помогите. Должен ли я использовать кривую ROC или CAP вместо Precision_score? Спасибо.
Подробнее здесь: https://stackoverflow.com/questions/607 ... classifier
Мобильная версия