Как я могу эффективно обрабатывать несбалансированные наборы данных в машинном обучении? - Цифровое Кемерово

Как я могу эффективно обрабатывать несбалансированные наборы данных в машинном обучении? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как я могу эффективно обрабатывать несбалансированные наборы данных в машинном обучении?

Цитата

Сообщение Anonymous » 26 ноя 2024, 21:11

Я работаю над проблемой двоичной классификации со значительно несбалансированным набором данных (распределение классов 90:10). Использование показателей стандартной точности не дает значимого понимания производительности модели.
Я пробовал увеличить выборку класса меньшинства и уменьшить выборку класса большинства, но этот подход приводит либо к переоснащению, либо к потере информации. Я также экспериментировал с экономичным обучением, но это не привело к значительному улучшению результатов.
Каковы некоторые эффективные методы или стратегии, такие как расширенные методы выборки, ансамблевое обучение или метрическое обучение? оптимизация, которая могла бы помочь решить эту проблему? Не могли бы вы также предложить какие-либо библиотеки Python, которые специализируются на решении проблем дисбаланса?
Я ищу передовые стратегии для обработки несбалансированных наборов данных, включая ансамблевые методы, оптимизацию показателей или методы предварительной обработки.

Подробнее здесь: https://stackoverflow.com/questions/792 ... e-learning

1732644660

Anonymous

Я работаю над проблемой двоичной классификации со значительно несбалансированным набором данных (распределение классов 90:10). Использование показателей стандартной точности не дает значимого понимания производительности модели.
Я пробовал увеличить выборку класса меньшинства и уменьшить выборку класса большинства, но этот подход приводит либо к переоснащению, либо к потере информации. Я также экспериментировал с экономичным обучением, но это не привело к значительному улучшению результатов.
Каковы некоторые эффективные методы или стратегии, такие как расширенные методы выборки, ансамблевое обучение или метрическое обучение? оптимизация, которая могла бы помочь решить эту проблему? Не могли бы вы также предложить какие-либо библиотеки Python, которые специализируются на решении проблем дисбаланса?
Я ищу передовые стратегии для обработки несбалансированных наборов данных, включая ансамблевые методы, оптимизацию показателей или методы предварительной обработки. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79227104/how-can-i-handle-imbalanced-datasets-effectively-in-machine-learning[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»