ValueError: если n_samples=0, test_size=0,2 и train_size=None, результирующий набор поездов будет пустым. Отрегулируйте

ValueError: если n_samples=0, test_size=0,2 и train_size=None, результирующий набор поездов будет пустым. Отрегулируйте ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

ValueError: если n_samples=0, test_size=0,2 и train_size=None, результирующий набор поездов будет пустым. Отрегулируйте

Цитата

Сообщение Anonymous » 17 июл 2024, 16:38

Я написал программу классификации текста. Когда я запускаю программу, она вылетает с ошибкой, как показано на этом снимке экрана:
[img]https://i.sstatic.net /wDoXv.jpg[/img]

ValueError: если n_samples=0, test_size=0.2 и train_size=None, результирующий набор поездов будет пустым. Настройте любой из вышеупомянутых параметров.

Вот мой код:

Код: Выделить всё

from sklearn.model_selection import train_test_split
from gensim.models.word2vec import Word2Vec
from sklearn.preprocessing import scale
from sklearn.linear_model import SGDClassifier
import nltk, string, json
import numpy as np

def cleanText(corpus):
reviews = []
for dd in corpus:
#for d in dd:
try:
words = nltk.word_tokenize(dd['description'])
words = [w.lower() for w in words]
reviews.append(words)
#break
except:
pass
return reviews

with open('C:\\NLP\\bad.json') as fin:
text = json.load(fin)
neg_rev = cleanText(text)

with open('C:\\NLP\\good.json') as fin:
text = json.load(fin)
pos_rev = cleanText(text)

#1 for positive sentiment, 0 for negative
y = np.concatenate((np.ones(len(pos_rev)), np.zeros(len(neg_rev))))

x_train, x_test, y_train, y_test = train_test_split(np.concatenate((pos_rev, neg_rev)), y, test_size=0.2)

Данные, которые я использую, доступны здесь:

Плохо;
Хорошо

Как бы я это исправил ошибка?

Подробнее здесь: https://stackoverflow.com/questions/600 ... esulting-t

1721223532

Anonymous

Я написал программу классификации текста. Когда я запускаю программу, она вылетает с ошибкой, как показано на этом снимке экрана:
[img]https://i.sstatic.net /wDoXv.jpg[/img]


ValueError: если n_samples=0, test_size=0.2 и train_size=None, результирующий набор поездов будет пустым. Настройте любой из вышеупомянутых параметров.

Вот мой код:
[code]from sklearn.model_selection import train_test_split
from gensim.models.word2vec import Word2Vec
from sklearn.preprocessing import scale
from sklearn.linear_model import SGDClassifier
import nltk, string, json
import numpy as np

def cleanText(corpus):
reviews = []
for dd in corpus:
#for d in dd:
try:
words = nltk.word_tokenize(dd['description'])
words = [w.lower() for w in words]
reviews.append(words)
#break
except:
pass
return reviews

with open('C:\\NLP\\bad.json') as fin:
text = json.load(fin)
neg_rev = cleanText(text)

with open('C:\\NLP\\good.json') as fin:
text = json.load(fin)
pos_rev = cleanText(text)

#1 for positive sentiment, 0 for negative
y = np.concatenate((np.ones(len(pos_rev)), np.zeros(len(neg_rev))))

x_train, x_test, y_train, y_test = train_test_split(np.concatenate((pos_rev, neg_rev)), y, test_size=0.2)
[/code]
Данные, которые я использую, доступны здесь:
[list]
[*]Плохо;

[*]Хорошо

[/list]
Как бы я это исправил ошибка? 

Подробнее здесь: [url]https://stackoverflow.com/questions/60043276/valueerror-with-n-samples-0-test-size-0-2-and-train-size-none-the-resulting-t[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

ПРЕДУПРЕЖДЕНИЕ Python: повторение (повторный (total = 4, connect = none, read = none, redirect = none, nate = none))

Последнее сообщение Anonymous « 13 фев 2025, 14:02
Добавлено в форуме Python

Anonymous » 13 фев 2025, 14:02 » в форуме Python

Я пытаюсь сделать PIP Install-upgrade pip и сохранить

получить эту ошибку:
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'ProxyError('Cannot connect to proxy.', NewConnection...

0 Ответы

87 Просмотры

Последнее сообщение Anonymous
13 фев 2025, 14:02
Ядро Jupyter Lab умирает до запуска Train.train()

Последнее сообщение Anonymous « 16 сен 2024, 20:38
Добавлено в форуме Python

Anonymous » 16 сен 2024, 20:38 » в форуме Python

Работаю над тонкой настройкой phi-3.5-mini, и при попытке запустить Trainer.train() я получаю следующую ошибку:
***** Running training *****
Num examples = 647
Num Epochs = 3
Instantaneous batch size per device = 8
Total train batch size (w....

0 Ответы

54 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 20:38
Ядро Jupyter Lab умирает до запуска Train.train()

Последнее сообщение Anonymous « 16 сен 2024, 23:29
Добавлено в форуме Python

Anonymous » 16 сен 2024, 23:29 » в форуме Python

Работаю над тонкой настройкой phi-3.5-mini, и при попытке запустить Trainer.train() я получаю следующую ошибку:
***** Running training *****
Num examples = 647
Num Epochs = 3
Instantaneous batch size per device = 8
Total train batch size (w....

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 23:29
Seq2Seq train.train() продолжает выдавать ошибку индексации

Последнее сообщение Anonymous « 20 сен 2024, 11:45
Добавлено в форуме Python

Anonymous » 20 сен 2024, 11:45 » в форуме Python

Я пытаюсь выполнить машинный перевод с хинди на санскрит, используя модель NLLB. Но я продолжаю получать сообщение об ошибке:

IndexError: Неверный ключ: 39463 выходит за пределы размера 0.

Ошибка возникает при обучении предварительно обученной...

0 Ответы

48 Просмотры

Последнее сообщение Anonymous
20 сен 2024, 11:45
Seq2Seq train.train() продолжает выдавать ошибку индексации

Последнее сообщение Anonymous « 20 сен 2024, 12:56
Добавлено в форуме Python

Anonymous » 20 сен 2024, 12:56 » в форуме Python

Я пытаюсь выполнить машинный перевод с хинди на санскрит, используя модель NLLB. Но я продолжаю получать сообщение об ошибке:

IndexError: Неверный ключ: 39463 выходит за пределы размера 0.

Ошибка возникает при обучении предварительно обученной...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
20 сен 2024, 12:56

Вернуться в «Python»