Как улучшить производительность модели многоклассовой классификации случайного леса? - Цифровое Кемерово

Как улучшить производительность модели многоклассовой классификации случайного леса? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как улучшить производительность модели многоклассовой классификации случайного леса?

Цитата

Сообщение Anonymous » 30 дек 2024, 15:45

Я работаю над мультиклассовой классификацией, позволяющей разделить клиентов на три разных класса на основе их покупательского поведения и демографических данных. Я не могу раскрыть набор данных полностью, но в целом он содержит около 300 признаков и 50 000 строк. Я пробовал следующие методы, но мне не удалось достичь точности выше 50 %:

Настройка гиперпараметров (я использую настроенные гиперпараметры после выполнения GridSearchCV)
Нормализация набора данных и последующий запуск моих моделей.
Пробовал разные методы классификации: OneVsRestClassifier, RandomForestClassification, SVM, KNN и LDA
Я также удалил ненужные функции и попробовал запустить свои модели.
Мои классы были несбалансированы, поэтому я также попробовал использовать class_weight = сбалансированный, передискретизацию. использование SMOTE, понижение и повторная выборка.

Есть ли что-то еще, что я могу попробовать улучшить производительность (f-оценка, точность и полнота)?

Подробнее здесь: https://stackoverflow.com/questions/536 ... tion-model

Реклама

1735562747

Anonymous

Я работаю над мультиклассовой классификацией, позволяющей разделить клиентов на три разных класса на основе их покупательского поведения и демографических данных. Я не могу раскрыть набор данных полностью, но в целом он содержит около 300 признаков и 50 000 строк. Я пробовал следующие методы, но мне не удалось достичь точности выше 50 %:
[list]
[*]Настройка гиперпараметров (я использую настроенные гиперпараметры после выполнения GridSearchCV)
Нормализация набора данных и последующий запуск моих моделей.
[*]Пробовал разные методы классификации: OneVsRestClassifier, RandomForestClassification, SVM, KNN и LDA
[*]Я также удалил ненужные функции и попробовал запустить свои модели.
[*]Мои классы были несбалансированы, поэтому я также попробовал использовать class_weight = сбалансированный, передискретизацию. использование SMOTE, понижение и повторная выборка.
[/list]
Есть ли что-то еще, что я могу попробовать улучшить производительность (f-оценка, точность и полнота)? 

Подробнее здесь: [url]https://stackoverflow.com/questions/53634808/how-to-improve-performance-of-random-forest-multiclass-classification-model[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как улучшить производительность модели случайного леса для больших несбалансированных наборов данных в Python?

Последнее сообщение Anonymous « 18 окт 2024, 04:19
Добавлено в форуме Python

Anonymous » 18 окт 2024, 04:19 » в форуме Python

Я работал над моделью случайного леса, чтобы прогнозировать отток сотрудников. Мой набор данных сильно несбалансирован: около 80% случаев не истощения и 20% случаев истощения. Хотя я попробовал SMOTE для балансировки классов, точность моей модели...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
18 окт 2024, 04:19
Как улучшить производительность модели случайного леса для больших несбалансированных наборов данных?

Последнее сообщение Anonymous « 18 окт 2024, 11:56
Добавлено в форуме Python

Anonymous » 18 окт 2024, 11:56 » в форуме Python

Я работал над моделью случайного леса, чтобы прогнозировать отток сотрудников. Мой набор данных сильно несбалансирован: около 80% случаев не истощения и 20% случаев истощения. Хотя я попробовал SMOTE для балансировки классов, точность моей модели...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
18 окт 2024, 11:56
Как улучшить производительность модели CNN для классификации изображений в PyTorch?

Последнее сообщение Anonymous « 16 дек 2024, 02:40
Добавлено в форуме Python

Anonymous » 16 дек 2024, 02:40 » в форуме Python

Я работаю над проектом классификации изображений с использованием PyTorch и реализовал модель сверточной нейронной сети (CNN). Хотя модель функциональна, я ищу способы улучшить ее производительность, особенно с точки зрения точности проверки и...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
16 дек 2024, 02:40
Как применить CalibratedClassifierCV при внешней проверке модели случайного леса

Последнее сообщение Anonymous « 02 июл 2024, 02:12
Добавлено в форуме Python

Anonymous » 02 июл 2024, 02:12 » в форуме Python

У меня есть модель, обученная на моих данных. Я использовал joblib, чтобы получить модель, и поделился ею с другими командами, чтобы оценить производительность модели на их данных. Один из членов команды вернулся и сказал, что модели не очень хорошо...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 02:12
Как применить CalibratedClassifierCV к внешней проверке модели случайного леса?

Последнее сообщение Anonymous « 02 июл 2024, 04:19
Добавлено в форуме Python

Anonymous » 02 июл 2024, 04:19 » в форуме Python

У меня есть модель, обученная на моих данных. Я использовал JobLib, чтобы получить модель, и поделился ею с другими командами, чтобы оценить эффективность модели на их данных. Один из членов команды вернулся и сказал, что модели не очень хорошо...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 04:19

Вернуться в «Python»

Programmiererforum