Как использовать SelectFromModel с cross_validate в scikit-learn? ⇐ Python
Как использовать SelectFromModel с cross_validate в scikit-learn?
Я пытаюсь использовать SelectFromModel для выбора объектов из моего набора данных перед обучением модели DecisionTreeClassifier. Я также использую cross_validate для оценки производительности модели. Однако я не уверен, как использовать эти две функции вместе.
импортировать numpy как np из sklearn.feature_selection импортировать SelectFromModel из sklearn.ensemble import RandomForestClassifier из sklearn.tree импортировать DecisionTreeClassifier из sklearn.model_selection импорта cross_validate # Разделить набор данных на объекты и цели X = dataset.drop('target_column', axis=1) # Удалить 'target_column' с фактическим именем целевого столбца y = набор данных['target_column'] # Выбор функции с помощью SelectFromModel(RandomForestClassifier) селектор = SelectFromModel(RandomForestClassifier(n_estimators=100, random_state=42)) X = selector.fit_transform(X, y) num_selected_features = X.shape[1] print(f'Количество выбранных функций: {num_selected_features}') # обучить DecisionTreeClassifier, используя специфичность в качестве метрики оценки классификатор = DecisionTreeClassifier(критерий="энтропия", min_samples_split=5, случайное_состояние=0) # Перекрестная проверка модели, используя специфичность в качестве показателя оценки. cross_validation_results = cross_validate(оценщик=классификатор, Х=Х, у=у, резюме = 5, оценка = "точность", return_train_score=Истина) # Распечатываем результаты перекрестной проверки печать (cross_validation_results)
Я пытаюсь использовать SelectFromModel для выбора объектов из моего набора данных перед обучением модели DecisionTreeClassifier. Я также использую cross_validate для оценки производительности модели. Однако я не уверен, как использовать эти две функции вместе.
импортировать numpy как np из sklearn.feature_selection импортировать SelectFromModel из sklearn.ensemble import RandomForestClassifier из sklearn.tree импортировать DecisionTreeClassifier из sklearn.model_selection импорта cross_validate # Разделить набор данных на объекты и цели X = dataset.drop('target_column', axis=1) # Удалить 'target_column' с фактическим именем целевого столбца y = набор данных['target_column'] # Выбор функции с помощью SelectFromModel(RandomForestClassifier) селектор = SelectFromModel(RandomForestClassifier(n_estimators=100, random_state=42)) X = selector.fit_transform(X, y) num_selected_features = X.shape[1] print(f'Количество выбранных функций: {num_selected_features}') # обучить DecisionTreeClassifier, используя специфичность в качестве метрики оценки классификатор = DecisionTreeClassifier(критерий="энтропия", min_samples_split=5, случайное_состояние=0) # Перекрестная проверка модели, используя специфичность в качестве показателя оценки. cross_validation_results = cross_validate(оценщик=классификатор, Х=Х, у=у, резюме = 5, оценка = "точность", return_train_score=Истина) # Распечатываем результаты перекрестной проверки печать (cross_validation_results)
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение