Я работаю над проблемой двоичной классификации со значительно несбалансированным набором данных (распределение классов 90:10). Использование показателей стандартной точности не дает значимого понимания производительности модели.
Я пробовал увеличить выборку класса меньшинства и уменьшить выборку класса большинства, но этот подход приводит либо к переоснащению, либо к потере информации. Я также экспериментировал с экономичным обучением, но это не привело к значительному улучшению результатов.
Каковы некоторые эффективные методы или стратегии, такие как расширенные методы выборки, ансамблевое обучение или метрическое обучение? оптимизация, которая могла бы помочь решить эту проблему? Не могли бы вы также предложить какие-либо библиотеки Python, которые специализируются на решении проблем дисбаланса?
Я ищу передовые стратегии для обработки несбалансированных наборов данных, включая ансамблевые методы, оптимизацию показателей или методы предварительной обработки.
Подробнее здесь: https://stackoverflow.com/questions/792 ... e-learning
Как я могу эффективно обрабатывать несбалансированные наборы данных в машинном обучении? ⇐ Python
Программы на Python
1732644660
Anonymous
Я работаю над проблемой двоичной классификации со значительно несбалансированным набором данных (распределение классов 90:10). Использование показателей стандартной точности не дает значимого понимания производительности модели.
Я пробовал увеличить выборку класса меньшинства и уменьшить выборку класса большинства, но этот подход приводит либо к переоснащению, либо к потере информации. Я также экспериментировал с экономичным обучением, но это не привело к значительному улучшению результатов.
Каковы некоторые эффективные методы или стратегии, такие как расширенные методы выборки, ансамблевое обучение или метрическое обучение? оптимизация, которая могла бы помочь решить эту проблему? Не могли бы вы также предложить какие-либо библиотеки Python, которые специализируются на решении проблем дисбаланса?
Я ищу передовые стратегии для обработки несбалансированных наборов данных, включая ансамблевые методы, оптимизацию показателей или методы предварительной обработки.
Подробнее здесь: [url]https://stackoverflow.com/questions/79227104/how-can-i-handle-imbalanced-datasets-effectively-in-machine-learning[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия