Матрица путаницы для 10 перекрестных складов - как сделать это Pandas DataFrame?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Матрица путаницы для 10 перекрестных складов - как сделать это Pandas DataFrame?

Сообщение Anonymous »

Я пытаюсь получить матрицу путаницы в 10 раз для любых моделей (случайный лес, дерево решений, наивное байесов. : < /p>

Код: Выделить всё

from sklearn.model_selection import train_test_split
from sklearn import model_selection
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import roc_auc_score

# implementing train-test-split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.34, random_state=66)

# random forest model creation
rfc = RandomForestClassifier(n_estimators=200, random_state=39, max_depth=4)
rfc.fit(X_train,y_train)
# predictions
rfc_predict = rfc.predict(X_test)

print("=== Confusion Matrix ===")
print(confusion_matrix(y_test, rfc_predict))
print('\n')
print("=== Classification Report ===")
print(classification_report(y_test, rfc_predict))
< /code>
out [1]: < /p>
=== Confusion Matrix ===
[[16243  1011]
[  827 16457]]

=== Classification Report ===
precision    recall  f1-score   support

0       0.95      0.94      0.95     17254
1       0.94      0.95      0.95     17284

accuracy                           0.95     34538
macro avg       0.95      0.95      0.95     34538
weighted avg       0.95      0.95      0.95     34538
Но теперь я хочу получить матрицу путаницы для 10 CV Fold . Как мне подходить или сделать это. Я попробовал это, но не работал. < /P>
# from sklearn import cross_validation
from sklearn.model_selection import cross_validate
kfold = KFold(n_splits=10)

conf_matrix_list_of_arrays = []
kf = cross_validate(rfc, X, y, cv=kfold)
print(kf)
for train_index, test_index in kf:

X_train, X_test = X[train_index], X[test_index]
y_train, y_test = y[train_index], y[test_index]

rfc.fit(X_train, y_train)
conf_matrix = confusion_matrix(y_test, rfc.predict(X_test))
conf_matrix_list_of_arrays.append(conf_matrix)
< /code>
Набор данных состоит из этого DataFrame: < /p>

Параллельное затенение серии температур. Солнечная панель процент оттенка ячейки Isshade
30 10 1 2 10 1.11 2,19 1,97 1985 1 20,0 1
27 5 2 10 10 2,33 4,16 1,79 1517 3 100,0 1
30 5 2 7 10 2,01 4,34 2,16 2,16. 3532 1 70,0 1
40 2 4 3 8 1,13 -20,87 -18,47 6180 1 37,5 1
45 5 2 4 10 1,13 6,52 5,77 8812 3 40,0 1
< /pre>

Подробнее здесь: https://stackoverflow.com/questions/646 ... -dataframe
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Диаграмма перекрестных перекрестных потоков (Санки или другие)
    Anonymous » » в форуме Python
    0 Ответы
    7 Просмотры
    Последнее сообщение Anonymous
  • Многоклассовая матрица путаницы
    Anonymous » » в форуме Python
    0 Ответы
    12 Просмотры
    Последнее сообщение Anonymous
  • Матрица путаницы, отображающая только одну сторону для модели прогнозирования
    Anonymous » » в форуме Python
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous
  • Y_test [i]! = y_pred [i], но соответствующая матрица путаницы противоречивая
    Anonymous » » в форуме Python
    0 Ответы
    23 Просмотры
    Последнее сообщение Anonymous
  • Матрица путаницы для 10-кратной перекрестной проверки в Scikit Learn
    Anonymous » » в форуме Python
    0 Ответы
    28 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»