Я работаю над мультиклассовой классификацией, позволяющей разделить клиентов на три разных класса на основе их покупательского поведения и демографических данных. Я не могу раскрыть набор данных полностью, но в целом он содержит около 300 признаков и 50 000 строк. Я пробовал следующие методы, но мне не удалось достичь точности выше 50 %:
Настройка гиперпараметров (я использую настроенные гиперпараметры после выполнения GridSearchCV)
Нормализация набора данных и последующий запуск моих моделей.
Пробовал разные методы классификации: OneVsRestClassifier, RandomForestClassification, SVM, KNN и LDA
Я также удалил ненужные функции и попробовал запустить свои модели.
Мои классы были несбалансированы, поэтому я также попробовал использовать class_weight = сбалансированный, передискретизацию. использование SMOTE, понижение и повторная выборка.
Есть ли что-то еще, что я могу попробовать улучшить производительность (f-оценка, точность и полнота)?
Я работаю над мультиклассовой классификацией, позволяющей разделить клиентов на три разных класса на основе их покупательского поведения и демографических данных. Я не могу раскрыть набор данных полностью, но в целом он содержит около 300 признаков и 50 000 строк. Я пробовал следующие методы, но мне не удалось достичь точности выше 50 %: [list] [*]Настройка гиперпараметров (я использую настроенные гиперпараметры после выполнения GridSearchCV) Нормализация набора данных и последующий запуск моих моделей. [*]Пробовал разные методы классификации: OneVsRestClassifier, RandomForestClassification, SVM, KNN и LDA [*]Я также удалил ненужные функции и попробовал запустить свои модели. [*]Мои классы были несбалансированы, поэтому я также попробовал использовать class_weight = сбалансированный, передискретизацию. использование SMOTE, понижение и повторная выборка. [/list] Есть ли что-то еще, что я могу попробовать улучшить производительность (f-оценка, точность и полнота)?
Я работал над моделью случайного леса, чтобы прогнозировать отток сотрудников. Мой набор данных сильно несбалансирован: около 80% случаев не истощения и 20% случаев истощения. Хотя я попробовал SMOTE для балансировки классов, точность моей модели...
Я работал над моделью случайного леса, чтобы прогнозировать отток сотрудников. Мой набор данных сильно несбалансирован: около 80% случаев не истощения и 20% случаев истощения. Хотя я попробовал SMOTE для балансировки классов, точность моей модели...
Я работаю над проектом классификации изображений с использованием PyTorch и реализовал модель сверточной нейронной сети (CNN). Хотя модель функциональна, я ищу способы улучшить ее производительность, особенно с точки зрения точности проверки и...
У меня есть модель, обученная на моих данных. Я использовал joblib, чтобы получить модель, и поделился ею с другими командами, чтобы оценить производительность модели на их данных. Один из членов команды вернулся и сказал, что модели не очень хорошо...
У меня есть модель, обученная на моих данных. Я использовал JobLib, чтобы получить модель, и поделился ею с другими командами, чтобы оценить эффективность модели на их данных. Один из членов команды вернулся и сказал, что модели не очень хорошо...