Sklearn логистическую регрессию с несбалансированными классамиPython

Программы на Python
Ответить
Anonymous
 Sklearn логистическую регрессию с несбалансированными классами

Сообщение Anonymous »

Я решаю задачу классификации с помощью логистической регрессии sklearn в Python.

Моя проблема является общей/общей. У меня есть набор данных с двумя классами/результатами (положительный/отрицательный или 1/0), но набор сильно несбалансирован. Есть ~5% положительных и ~95% отрицательных.

Я знаю, что есть несколько способов справиться с такой несбалансированной проблемой, но не нашел подходящего. объяснение того, как правильно реализовать использование пакета sklearn.

На данный момент я построил сбалансированный обучающий набор, выбрав записи с положительным результатом и равным количество случайно выбранных отрицательных записей. Затем я могу обучить модель этому набору, но мне неясно, как изменить модель, чтобы затем работать с исходной несбалансированной совокупностью/набором.

Каковы конкретные шаги для этого? Я просмотрел документацию и примеры sklearn и не нашел хорошего объяснения.

Подробнее здесь: https://stackoverflow.com/questions/148 ... ed-classes
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»