Почему моя классификация текста с несколькими метками имеет низкую точность?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Почему моя классификация текста с несколькими метками имеет низкую точность?

Сообщение Anonymous »

поэтому я использую этот набор данных: https://www.kaggle.com/datasets/madhavm ... d-emotions
Это видео в качестве руководства:
Поэтому я изменил значение True на 1 и False на 0. У меня также есть удаление классов. с менее чем 30 экземплярами в нем. Там у меня есть только текст с этими классами:

Код: Выделить всё

happy                        182
satisfied                    133
calm                          99
calm, happy, satisfied        77
happy, satisfied              73
proud                         62
happy, proud, satisfied       54
excited, happy, satisfied     46
calm, satisfied               42
calm, happy                   41
excited, happy, proud         37
proud, satisfied              33
frustrated                    32
excited, happy                31
excited                       31
Name: Emotions Felt, dtype: int64
Я использую этот код для переключения между моделями и методами машинного обучения:

Код: Выделить всё

def build_model (model,mlb_estimator,xtrain,ytrain,xtest,ytest):
clf = mlb_estimator(model)
clf.fit(xtrain,ytrain)
clf_predictions = clf.predict(xtest)
acc = accuracy_score(ytest,clf_predictions)
ham = hamming_loss(y_test,clf_predictions)
result = {"accuracy":acc,"hamming_score":ham}
return result

clf_chain_model = build_model(MultinomialNB(),ClassifierChain,X_train,y_train,X_test,y_test)
Я добился точности:

Код: Выделить всё

{'accuracy': 0.1815068493150685, 'hamming_score': 0.2054794520547945}
Итак, мой вопрос:
  • почему моя точность такая низкая?
  • как добиться более высокой точности?
Итак, я попробовал поменять модели с помощью LogisticReгрессия, KNeighborsClassifier, DecisionTreeClassifier, GaussianNB, MultinomialNB и RandomForestClassifier. Вдобавок я также заменяю методы машинного обучения на BinaryRelevance, ClassifierChain и LabelPowerset для каждой модели. Я еще не пробовал использовать модели нейронных сетей или BERT.

Подробнее здесь: https://stackoverflow.com/questions/782 ... w-accuracy
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»