Проблема с использованием tokenizer.encode_plus

Проблема с использованием tokenizer.encode_plus ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Проблема с использованием tokenizer.encode_plus

Цитата

Сообщение Anonymous » 31 янв 2026, 07:10

Блокнот #jupyter
Я пытаюсь изучить классификатор BERT с помощью https://colab.research.google.com/drive ... Bdb3pt8LuQ
В этом коллабе, начиная с "Токенизировать все предложение....."
В этом месте у меня возникла проблема: «TypeError: _tokenize() получил неожиданный аргумент ключевого слова 'pad_to_max_length'»
**
input_ids = []
attention_masks = []

for sent in sentences:
encoded_dict = tokenizer.encode_plus(
sent, # Sentence to encode.
add_special_tokens = True, # Add '[CLS]' and '[SEP]'
max_length = 64, # Pad & truncate all sentences.
pad_to_max_length = True,
return_attention_mask = True, # Construct attn. masks.
return_tensors = 'pt', # Return pytorch tensors.
)

Подробнее здесь: https://stackoverflow.com/questions/638 ... ncode-plus

1769832605

Anonymous

Блокнот #jupyter
Я пытаюсь изучить классификатор BERT с помощью https://colab.research.google.com/drive/1pTuQhug6Dhl9XalKB0zUGf4FIdYFlpcX#scrollTo=2bBdb3pt8LuQ
В этом коллабе, начиная с "Токенизировать все предложение....."
В этом месте у меня возникла проблема: «TypeError: _tokenize() получил неожиданный аргумент ключевого слова 'pad_to_max_length'»
**
input_ids = []
attention_masks = []

for sent in sentences:
encoded_dict = tokenizer.encode_plus(
sent,                      # Sentence to encode.
add_special_tokens = True, # Add '[CLS]' and '[SEP]'
max_length = 64,           # Pad & truncate all sentences.
pad_to_max_length = True,
return_attention_mask = True,   # Construct attn. masks.
return_tensors = 'pt',     # Return pytorch tensors.
)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/63884856/trouble-with-using-tokenizer-encode-plus[/url]