ValueError: если n_samples=0, test_size=0,2 и train_size=None, результирующий набор поездов будет пустым. Отрегулируйте Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 ValueError: если n_samples=0, test_size=0,2 и train_size=None, результирующий набор поездов будет пустым. Отрегулируйте

Сообщение Anonymous »

Я написал программу классификации текста. Когда я запускаю программу, она вылетает с ошибкой, как показано на этом снимке экрана:
[img]https://i.sstatic.net /wDoXv.jpg[/img]


ValueError: если n_samples=0, test_size=0.2 и train_size=None, результирующий набор поездов будет пустым. Настройте любой из вышеупомянутых параметров.

Вот мой код:

Код: Выделить всё

from sklearn.model_selection import train_test_split
from gensim.models.word2vec import Word2Vec
from sklearn.preprocessing import scale
from sklearn.linear_model import SGDClassifier
import nltk, string, json
import numpy as np

def cleanText(corpus):
reviews = []
for dd in corpus:
#for d in dd:
try:
words = nltk.word_tokenize(dd['description'])
words = [w.lower() for w in words]
reviews.append(words)
#break
except:
pass
return reviews

with open('C:\\NLP\\bad.json') as fin:
text = json.load(fin)
neg_rev = cleanText(text)

with open('C:\\NLP\\good.json') as fin:
text = json.load(fin)
pos_rev = cleanText(text)

#1 for positive sentiment, 0 for negative
y = np.concatenate((np.ones(len(pos_rev)), np.zeros(len(neg_rev))))

x_train, x_test, y_train, y_test = train_test_split(np.concatenate((pos_rev, neg_rev)), y, test_size=0.2)
Данные, которые я использую, доступны здесь:
  • Плохо;
  • Хорошо
Как бы я это исправил ошибка?

Подробнее здесь: https://stackoverflow.com/questions/600 ... esulting-t
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • ПРЕДУПРЕЖДЕНИЕ Python: повторение (повторный (total = 4, connect = none, read = none, redirect = none, nate = none))
    Anonymous » » в форуме Python
    0 Ответы
    87 Просмотры
    Последнее сообщение Anonymous
  • Ядро Jupyter Lab умирает до запуска Train.train()
    Anonymous » » в форуме Python
    0 Ответы
    54 Просмотры
    Последнее сообщение Anonymous
  • Ядро Jupyter Lab умирает до запуска Train.train()
    Anonymous » » в форуме Python
    0 Ответы
    44 Просмотры
    Последнее сообщение Anonymous
  • Seq2Seq train.train() продолжает выдавать ошибку индексации
    Anonymous » » в форуме Python
    0 Ответы
    48 Просмотры
    Последнее сообщение Anonymous
  • Seq2Seq train.train() продолжает выдавать ошибку индексации
    Anonymous » » в форуме Python
    0 Ответы
    26 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»