Как повысить AUC логистической регрессии выше 0,91 для модели прогнозирования оттока клиентов?Python

Программы на Python
Ответить
Anonymous
 Как повысить AUC логистической регрессии выше 0,91 для модели прогнозирования оттока клиентов?

Сообщение Anonymous »

Я создаю модель бинарной классификации, чтобы прогнозировать отток клиентов. В настоящее время я использую модель логистической регрессии в scikit-learn, и мне удалось достичь показателя ROC-AUC 0,91 на моем тестовом наборе, но я ищу стратегии для дальнейшего ее улучшения.
Вот что в настоящее время включает в себя мой конвейер:
*Предварительная обработка: мгновенное кодирование для категориальных переменных (таких как тип контракта и метод оплаты) и масштабирование числовых функций (например, срок службы и ежемесячный платеж). Расходы).
*Дисбаланс классов: применен class_weight='balanced' для обработки класса оттока меньшинства.
*Настройка гиперпараметров: использован GridSearchCV (5-кратное CV) для настройки параметра регуляризации C и проверены штрафы l1 и l2 с использованием liblinear решателя.
Поскольку логистическая регрессия опирается на линейные отношения, какие конкретные функции разрабатываются рекомендуются методы (например, термины взаимодействия, объединение непрерывных переменных) или преобразования данных, чтобы выявить нелинейные закономерности в наборе данных об оттоке и увеличить AUC выше 0,91?
Есть ли определенные закономерности в ложноположительных/отрицательных результатах, которые мне следует анализировать, чтобы направлять создание функций?

Подробнее здесь: https://stackoverflow.com/questions/799 ... ediction-m
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»