Как повысить AUC логистической регрессии выше 0,91 для модели прогнозирования оттока клиентов? - Цифровое Кемерово

Как повысить AUC логистической регрессии выше 0,91 для модели прогнозирования оттока клиентов? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как повысить AUC логистической регрессии выше 0,91 для модели прогнозирования оттока клиентов?

Цитата

Сообщение Anonymous » 09 мар 2026, 23:13

Я создаю модель бинарной классификации, чтобы прогнозировать отток клиентов. В настоящее время я использую модель логистической регрессии в scikit-learn, и мне удалось достичь показателя ROC-AUC 0,91 на моем тестовом наборе, но я ищу стратегии для дальнейшего ее улучшения.
Вот что в настоящее время включает в себя мой конвейер:
*Предварительная обработка: мгновенное кодирование для категориальных переменных (таких как тип контракта и метод оплаты) и масштабирование числовых функций (например, срок службы и ежемесячный платеж). Расходы).
*Дисбаланс классов: применен class_weight='balanced' для обработки класса оттока меньшинства.
*Настройка гиперпараметров: использован GridSearchCV (5-кратное CV) для настройки параметра регуляризации C и проверены штрафы l1 и l2 с использованием liblinear решателя.
Поскольку логистическая регрессия опирается на линейные отношения, какие конкретные функции разрабатываются рекомендуются методы (например, термины взаимодействия, объединение непрерывных переменных) или преобразования данных, чтобы выявить нелинейные закономерности в наборе данных об оттоке и увеличить AUC выше 0,91?
Есть ли определенные закономерности в ложноположительных/отрицательных результатах, которые мне следует анализировать, чтобы направлять создание функций?

Подробнее здесь: https://stackoverflow.com/questions/799 ... ediction-m

1773087191

Anonymous

Я создаю модель бинарной классификации, чтобы прогнозировать отток клиентов. В настоящее время я использую модель логистической регрессии в scikit-learn, и мне удалось достичь показателя ROC-AUC 0,91 на моем тестовом наборе, но я ищу стратегии для дальнейшего ее улучшения.
Вот что в настоящее время включает в себя мой конвейер:
*Предварительная обработка: мгновенное кодирование для категориальных переменных (таких как тип контракта и метод оплаты) и масштабирование числовых функций (например, срок службы и ежемесячный платеж). Расходы).
*Дисбаланс классов: применен class_weight='balanced' для обработки класса оттока меньшинства.
*Настройка гиперпараметров: использован GridSearchCV (5-кратное CV) для настройки параметра регуляризации C и проверены штрафы l1 и l2 с использованием liblinear решателя.
Поскольку логистическая регрессия опирается на линейные отношения, какие конкретные функции разрабатываются рекомендуются методы (например, термины взаимодействия, объединение непрерывных переменных) или преобразования данных, чтобы выявить нелинейные закономерности в наборе данных об оттоке и увеличить AUC выше 0,91?
Есть ли определенные закономерности в ложноположительных/отрицательных результатах, которые мне следует анализировать, чтобы направлять создание функций? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79904109/how-to-push-logistic-regression-auc-above-0-91-for-a-customer-churn-prediction-m[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»