Вложенный пример перекрестной проверки на Scikit-learnPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Вложенный пример перекрестной проверки на Scikit-learn

Сообщение Anonymous »

Я пытаюсь разобраться с примером вложенного и не вложенного резюме в Sklearn. Я проверил несколько ответов, но я все еще запутался в примере. Следовательно, из набора данных x, Внешний 10-кратный CV (для простоты n = 10) создает 10 учебных наборов и 10 тестовых наборов:

Код: Выделить всё

(Tr0, Te0),..., (Tr0, Te9)
Тогда, внутреннее Inner 10-CV Sptits Каждый набор обучения на 10 тренинга и 10 тестовых наборов:

Код: Выделить всё

From Tr0: (Tr0_0,Te_0_0), ... , (Tr0_9,Te0_9)
From Tr9: (Tr9_0,Te_9_0), ... , (Tr9_9,Te9_9)
Теперь, используя внутреннее резюме, мы можем найти лучшие значения c для каждого внешнего обучающего набора. Это делается путем проверки всех возможных значений c с внутренним CV. Значение, обеспечивающее наивысшую производительность (например, точность), выбирается для этого конкретного внешнего обучающего набора. Наконец, обнаружив лучшие значения c для каждого внешнего обучающего набора, мы можем рассчитать беспристрастную точность, используя внешние наборы тестов. С помощью этой процедуры образцы, используемые для идентификации наилучшего параметра (то есть c ), не используются для вычисления производительности классификатора, следовательно, мы имеем абсолютно беспристрастную проверку.inner_cv = KFold(n_splits=4, shuffle=True, random_state=i)
outer_cv = KFold(n_splits=4, shuffle=True, random_state=i)

# Non_nested parameter search and scoring
clf = GridSearchCV(estimator=svm, param_grid=p_grid, cv=inner_cv)
clf.fit(X_iris, y_iris)
non_nested_scores = clf.best_score_

# Nested CV with parameter optimization
nested_score = cross_val_score(clf, X=X_iris, y=y_iris, cv=outer_cv)
nested_scores = nested_score.mean()
< /code>
Из того, что я понимаю, код просто вычисляет оценки, используя две разные перекрестные проверки (т.е. различные разделения на обучение и набор тестирования). Оба они использовали весь набор данных. gridcv идентифицирует лучшие параметры с использованием одного (из двух CV), затем cross_val_score вычисляется со вторым CV, производительность при использовании лучших параметров. Что мне не хватает в примере?

Подробнее здесь: https://stackoverflow.com/questions/466 ... ikit-learn
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Пример вложенной перекрестной проверки в Scikit-learn
    Anonymous » » в форуме Python
    0 Ответы
    34 Просмотры
    Последнее сообщение Anonymous
  • Пример вложенной перекрестной проверки в Scikit-learn
    Anonymous » » в форуме Python
    0 Ответы
    20 Просмотры
    Последнее сообщение Anonymous
  • Как рассчитать коэффициент перекрестной проверки Leave-One-Out q2 для модели QSAR с использованием scikit-learn SVR?
    Anonymous » » в форуме Python
    0 Ответы
    45 Просмотры
    Последнее сообщение Anonymous
  • Матрица путаницы для 10-кратной перекрестной проверки в Scikit Learn
    Anonymous » » в форуме Python
    0 Ответы
    28 Просмотры
    Последнее сообщение Anonymous
  • Scikit изучает отрицательное значение оценки перекрестной проверки
    Anonymous » » в форуме Python
    0 Ответы
    18 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»