Удаление строк из кадра данных pandas вызывает ключевую ошибку в загрузчике данных.Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Удаление строк из кадра данных pandas вызывает ключевую ошибку в загрузчике данных.

Сообщение Anonymous »

Я пытаюсь загрузить некоторые данные в загрузчик данных.
При попытке предварительной обработки кадра данных, например. df.dropna(), проходя через фрейм данных, время от времени случайным образом выбрасывает «ключевые ошибки». Этого не происходит, если я не удаляю ни одной строки.
Создание набора данных:
# load data and add columns
column_names = ["id","category","labelStr","text"]
trainingData = pd.read_csv(r"Path.csv",names=column_names)
validationData = pd.read_csv(r"Path.csv",names=column_names)

trainingData = trainingData.drop(columns=['id', 'category'])
validationData = validationData.drop(columns=['id', 'category'])

trainingData = trainingData.dropna() ############### Adding this causes the keyerror

trainingData['text'] = trainingData['text'].apply(clean_tweet)

# convert String into int
label_encoder = LabelEncoder()
trainingData['label'] = label_encoder.fit_transform(trainingData[["labelStr"]])
validationData['label'] = label_encoder.transform(validationData[["labelStr"]])

# initialize tokenizer
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
MAX_LEN = 128 # Length should be enough as tweets are limited in length anyway

# create datasets
train_dataset = TweetsDataset(trainingData, tokenizer, MAX_LEN)
val_dataset = TweetsDataset(validationData, tokenizer, MAX_LEN)

Загрузчик данных
BATCH_SIZE = 16

train_loader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=BATCH_SIZE, shuffle=False)

for batch in train_loader:
print(batch)
break

Ошибка
KeyError Traceback (most recent call last)
...\lib\site-packages\pandas\core\indexes\base.py in get_loc(self, key, method, tolerance)
3079 try:
-> 3080 return self._engine.get_loc(casted_key)
3081 except KeyError as err:

pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.Int64HashTable.get_item()

pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.Int64HashTable.get_item()

KeyError: 63935

The above exception was the direct cause of the following exception:

KeyError Traceback (most recent call last)
in
5 val_loader = DataLoader(val_dataset, batch_size=BATCH_SIZE, shuffle=False)
6
----> 7 for batch in train_loader:
8 print(batch)
...
-> 3082 raise KeyError(key) from err
3083
3084 if tolerance is not None:

KeyError: 63935


Подробнее здесь: https://stackoverflow.com/questions/791 ... dataloader
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Как устранить ключевую ошибку в view.py в Django
    Anonymous » » в форуме Python
    0 Ответы
    14 Просмотры
    Последнее сообщение Anonymous
  • Вопрос о data_collator, выдающем ключевую ошибку в Hugging face
    Anonymous » » в форуме Python
    0 Ответы
    32 Просмотры
    Последнее сообщение Anonymous
  • Как пропустить ключевую ошибку в пандах?
    Anonymous » » в форуме Python
    0 Ответы
    9 Просмотры
    Последнее сообщение Anonymous
  • Ошибка в загрузчике данных PyTorch с num_workers>0 в VSC под WSL
    Anonymous » » в форуме Python
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous
  • Ошибка в загрузчике данных PyTorch с num_workers>0 в VSC под WSL
    Anonymous » » в форуме Python
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»