Предупреждение о точности вычислений при использовании GridSearchCV для логистической регрессии

Предупреждение о точности вычислений при использовании GridSearchCV для логистической регрессии ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Предупреждение о точности вычислений при использовании GridSearchCV для логистической регрессии

Цитата

Сообщение Anonymous » 24 окт 2024, 21:30

Я пытаюсь запустить GridSearchCV с оценщиком логистической регрессии и записать метрики точности модели, прецизионности, полноты и f1.
Однако я получаю следующую ошибку в метрике точности:< /p>

Код: Выделить всё

Precision is ill-defined and being set to 0.0 due to no predicted samples.
Use `zero_division` parameter to control this behavior

Я понимаю, почему получаю ошибку, поскольку в разбиении Kfold нет прогнозов с выходным значением, равным 1. Однако я не понимаю, как я могу установить для «zero_divison» значение 1 в GridSearchCV (переменная logistic_reg).
Исходный код

Код: Выделить всё

logistic_reg = GridSearchCV(estimator=LogisticRegression(penalty="l1", random_state=42, max_iter=10000), param_grid={
"C": [1e-4, 5e-4, 1e-3, 5e-3, 1e-2, 5e-2, 1e-1, 5e-1, 1, 5, 10, 20],
"solver": ["liblinear", "saga"]
}, scoring=["accuracy", "precision", "recall", "f1"], cv=StratifiedKFold(n_splits=10), refit="accuracy")

logistic_reg_X_train = self.X_train.copy()
logistic_reg_X_train.drop(self.columns_removed, axis=1, inplace=True)

logistic_reg.fit(logistic_reg_X_train, self.y_train)
logistic_reg_results = pd.DataFrame(logistic_reg.cv_results_)

Я попробовал изменить «precision» на Precision_score(zero_division=1), но это выдает еще одну ошибку (

Код: Выделить всё

missing 2 required positional arguments: 'y_true' and 'y_pred'). Опять же, я это понимаю, но два недостающих параметра не определены перед применением метода подгонки.
Как указать параметр 1zero_division

для показателя точности?
Изменить
Чего я не понимаю, так это того, что я расслаивал данные y в своем методе train_test_split и использовал StratifedKFold в GridSearchCV. Насколько я понимаю, данные поезда/теста будут иметь одинаковую долю разделения значений y, и то же самое должно происходить во время перекрестной проверки. Это означает, что в выборкахgridsearchcv данные должны иметь значения y как 0, так и 1, и, следовательно, точность не может равняться 0 (модель сможет рассчитать TP и FP, поскольку выборочные тестовые данные содержат выборки, где y равно 1). Я не знаю, куда идти дальше.

Подробнее здесь: https://stackoverflow.com/questions/665 ... regression

1729794604

Anonymous

Я пытаюсь запустить GridSearchCV с оценщиком логистической регрессии и записать метрики точности модели, прецизионности, полноты и f1.
Однако я получаю следующую ошибку в метрике точности:< /p>
[code]Precision is ill-defined and being set to 0.0 due to no predicted samples.
Use `zero_division` parameter to control this behavior
[/code]
Я понимаю, почему получаю ошибку, поскольку в разбиении Kfold нет прогнозов с выходным значением, равным 1. Однако я не понимаю, как я могу установить для «zero_divison» значение 1 в GridSearchCV (переменная logistic_reg).
Исходный код
[code]logistic_reg = GridSearchCV(estimator=LogisticRegression(penalty="l1", random_state=42, max_iter=10000), param_grid={
"C": [1e-4, 5e-4, 1e-3, 5e-3, 1e-2, 5e-2, 1e-1, 5e-1, 1, 5, 10, 20],
"solver": ["liblinear", "saga"]
}, scoring=["accuracy", "precision", "recall", "f1"], cv=StratifiedKFold(n_splits=10), refit="accuracy")

logistic_reg_X_train = self.X_train.copy()
logistic_reg_X_train.drop(self.columns_removed, axis=1, inplace=True)

logistic_reg.fit(logistic_reg_X_train, self.y_train)
logistic_reg_results = pd.DataFrame(logistic_reg.cv_results_)
[/code]
Я попробовал изменить «precision» на Precision_score(zero_division=1), но это выдает еще одну ошибку ([code]missing 2 required positional arguments: 'y_true' and 'y_pred'). Опять же, я это понимаю, но два недостающих параметра не определены перед применением метода подгонки.
Как указать параметр 1zero_division[/code] для показателя точности?
Изменить
Чего я не понимаю, так это того, что я расслаивал данные y в своем методе train_test_split и использовал StratifedKFold в GridSearchCV. Насколько я понимаю, данные поезда/теста будут иметь одинаковую долю разделения значений y, и то же самое должно происходить во время перекрестной проверки. Это означает, что в выборкахgridsearchcv данные должны иметь значения y как 0, так и 1, и, следовательно, точность не может равняться 0 (модель сможет рассчитать TP и FP, поскольку выборочные тестовые данные содержат выборки, где y равно 1). Я не знаю, куда идти дальше. 

Подробнее здесь: [url]https://stackoverflow.com/questions/66538197/precision-calculation-warning-when-using-gridsearchcv-for-logistic-regression[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Оптимизация производительности логистической регрессии GridSearchCV на больших наборах данных в sklearn

Последнее сообщение Anonymous « 03 авг 2024, 13:02
Добавлено в форуме Python

Anonymous » 03 авг 2024, 13:02 » в форуме Python

У меня возникла серьезная проблема с производительностью при использовании нескольких распространенных методов машинного обучения в sklearn. Я работаю над проблемой двоичной классификации с набором данных, содержащим 5 миллионов наблюдений и 100...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
03 авг 2024, 13:02
Почему я получаю предупреждение RunTime при вычислении функции стоимости для логистической регрессии?

Последнее сообщение Anonymous « 31 окт 2023, 07:25
Добавлено в форуме Python

Anonymous » 31 окт 2023, 07:25 » в форуме Python

:8: RuntimeWarning: в журнале обнаружено деление на ноль стоимость=(-y *np.log(g_i) - (1-y )*np.log(1-g_i)) :8: RuntimeWarning: в double_scalars обнаружено недопустимое значение стоимость=(-y *np.log(g_i) - (1-y )*np.log(1-g_i)) Нэн Это результат,...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
31 окт 2023, 07:25
Управление порогом в логистической регрессии в Scikit Learn

Последнее сообщение Anonymous « 13 май 2024, 20:16
Добавлено в форуме Python

Anonymous » 13 май 2024, 20:16 » в форуме Python

Я использую метод LogisticReprofit() в scikit-learn для сильно несбалансированного набора данных. Я даже переключил функцию class_weight на автоматический.

Я знаю, что в логистической регрессии можно узнать, каково пороговое значение. для...

0 Ответы

68 Просмотры

Последнее сообщение Anonymous
13 май 2024, 20:16
Проблема изменения формы в коде логистической регрессии

Последнее сообщение Anonymous « 04 июл 2024, 05:31
Добавлено в форуме Python

Anonymous » 04 июл 2024, 05:31 » в форуме Python

Я пытаюсь выполнить логистическую регрессию.
import pandas
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
import numpy as np

df = pd.read_csv( tested.csv )
df.dropna(inplace=True)
x = df
y = df
x_re =...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 05:31
Как настроить отсечение в модели логистической регрессии?

Последнее сообщение Anonymous « 06 июл 2024, 23:48
Добавлено в форуме Python

Anonymous » 06 июл 2024, 23:48 » в форуме Python

пример придуман для этого вопроса. скажем, я обучаю двоичный классификатор, используя пакет sklearn. У меня есть сбалансированный набор данных, половина положительных и половина отрицательных образцов. я разделил данные поезда/теста (пример кода...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
06 июл 2024, 23:48

Вернуться в «Python»