Как я могу эффективно обрабатывать несбалансированные наборы данных в машинном обучении?Python

Программы на Python
Ответить
Anonymous
 Как я могу эффективно обрабатывать несбалансированные наборы данных в машинном обучении?

Сообщение Anonymous »

Я работаю над проблемой двоичной классификации со значительно несбалансированным набором данных (распределение классов 90:10). Использование показателей стандартной точности не дает значимого понимания производительности модели.
Я пробовал увеличить выборку класса меньшинства и уменьшить выборку класса большинства, но этот подход приводит либо к переоснащению, либо к потере информации. Я также экспериментировал с экономичным обучением, но это не привело к значительному улучшению результатов.
Каковы некоторые эффективные методы или стратегии, такие как расширенные методы выборки, ансамблевое обучение или метрическое обучение? оптимизация, которая могла бы помочь решить эту проблему? Не могли бы вы также предложить какие-либо библиотеки Python, которые специализируются на решении проблем дисбаланса?
Я ищу передовые стратегии для обработки несбалансированных наборов данных, включая ансамблевые методы, оптимизацию показателей или методы предварительной обработки.

Подробнее здесь: https://stackoverflow.com/questions/792 ... e-learning
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»