Модель не вернула потерю / BertForQuestionAnswering.forward() получил неожиданный аргумент ключевого слова «метки»

Модель не вернула потерю / BertForQuestionAnswering.forward() получил неожиданный аргумент ключевого слова «метки» ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Модель не вернула потерю / BertForQuestionAnswering.forward() получил неожиданный аргумент ключевого слова «метки»

Цитата

Сообщение Anonymous » 20 окт 2023, 12:47

У меня есть эти данные:

intents.json:

{"версия": "0.1.0", "данные": [ {"id": "привет", «вопрос»: [«привет», «как дела»], «ответы»: [«привет!», «чем я могу вам помочь?»], "контекст": "" }, {"id": "пока", «вопрос»: [«Пока», «до свидания», «увидимся»], «ответы»: [»увидимся позже», «хорошего дня», «пока», «спасибо за визит»], "контекст": "" }, {"id": "погода", "вопрос": ["как погода", "прогноз погоды", "погода"], "ответы": ["погода хорошая", "у нас 25 градусов"], "контекст": "" } ] } и я пытаюсь создать бота, отвечающего на вопросы.

Я использую этот код:

из наборов данных импортируйте load_dataset импортировать наборы данных из трансформеров импортировать AutoTokenizer, AutoModel, TrainingArguments,\ Тренер, AutoModelForQuestionAnswering, DefaultDataCollator, \ DataCollatorForLanguageModeling MAX_LENGTH = 128 tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased') защита preprocess_func(x): вернуть токенизатор(x["id"], дополнение = 'max_length', усечение = Истина, max_length=MAX_LENGTH) train = load_dataset('json', data_files='intents.json', field='data', Split='train[:80%]') test = load_dataset('json', data_files='intents.json', field='data', Split='train[80%:]') data = datasets.DatasetDict({"train":train, "test": test}) токенизированный = data.map(preprocess_func, пакетный = True) #data_collator = DefaultDataCollator() data_collator = DataCollatorForLanguageModeling( tokenizer=токенизатор, mlm=True ) устройство = "процессор" модель = AutoModelForQuestionAnswering.from_pretrained('bert-base-uncased') модель = model.to(устройство) Training_args = TrainingArguments( output_dir="./результаты", Assessment_strategy="эпоха", Learning_rate=2e-5, per_device_train_batch_size = 2, num_train_epochs=2, вес_распад=0,01, ) тренер = Тренер( модель = модель, args=training_args, train_dataset=токенизированный["поезд"], токенизатор = токенизатор, data_collator = data_collator, ) тренер.поезд() и я получаю:

BertForQuestionAnswering.forward() получил неожиданный аргумент ключевого слова «метки»

но у меня нет меток в данных:

токенизированный DatasetDict({ поезд: Набор данных({ функции: ['контекст', 'id', 'вопрос', 'ответы', 'input_ids', 'token_type_ids', 'attention_mask'], количество_строк: 2 }) тест: Набор данных({ функции: ['контекст', 'id', 'вопрос', 'ответы', 'input_ids', 'token_type_ids', 'attention_mask'], количество_строк: 1 }) }) Если я использую:

DefaultDataCollator() вместо DataCollatorForLanguageModeling я получаю:

Модель не вернула потери из входных данных, а только следующие ключи: start_logits,end_logits

Я не уверен, что preprocess_func нужно еще что-то сделать.

Как, например, здесь
def preprocess_function(примеры): вопросы = [q.strip() для q в примерах["вопрос"]] входы = токенизатор( вопросы, примеры["контекст"], максимальная_длина = 512, truncation="только_секунда", return_offsets_mapping=Истина, дополнение = "максимальная_длина", ) offset_mapping = inputs.pop("offset_mapping") ответы = примеры["ответы"] start_positions = [] конечные_позиции = [] для i, смещение в перечислении (offset_mapping): ответ = ответы[я] start_char = ответ["ответ_старт"][0] end_char = ответ["ответ_старт"][0] + len(ответ["текст"][0]) последовательность_ид = inputs.sequence_ids(i) # Найдите начало и конец контекста идентификатор = 0 в то время как последовательность_ids[idx] != 1: идентификатор += 1 context_start = идентификатор в то время как последовательность_ids[idx] == 1: идентификатор += 1 context_end = идентификатор - 1 # Если ответ не полностью находится в контексте, пометьте его (0, 0) if offset[context_start][0] > end_char или offset[context_end][1] < начальный_символ: start_positions.append(0) end_positions.append(0) еще: # В противном случае это начальная и конечная позиции токена idx = начало_контекста while idx = end_char: идентификатор -= 1 end_positions.append(idx + 1) inputs["start_positions"] = start_positions inputs["end_positions"] = конечные_позиции возврат входных данных

1697795241

Anonymous


У меня есть эти данные:
 
intents.json:
 
{"версия": "0.1.0",     "данные":  [         {"id": "привет",         «вопрос»: [«привет», «как дела»],         «ответы»: [«привет!», «чем я могу вам помочь?»],         "контекст": ""         },                  {"id": "пока",         «вопрос»: [«Пока», «до свидания», «увидимся»],         «ответы»: [»увидимся позже», «хорошего дня», «пока», «спасибо за визит»],         "контекст": ""         },         {"id": "погода",         "вопрос": ["как погода", "прогноз погоды", "погода"],         "ответы": ["погода хорошая", "у нас 25 градусов"],         "контекст": ""         }     ] }  и я пытаюсь создать бота, отвечающего на вопросы.
 
Я использую этот код:
 
из наборов данных импортируйте load_dataset импортировать наборы данных из трансформеров импортировать AutoTokenizer, AutoModel, TrainingArguments,\     Тренер, AutoModelForQuestionAnswering, DefaultDataCollator, \         DataCollatorForLanguageModeling MAX_LENGTH = 128 tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased') защита preprocess_func(x):     вернуть токенизатор(x["id"],                      дополнение = 'max_length',                      усечение = Истина,                      max_length=MAX_LENGTH) train = load_dataset('json', data_files='intents.json', field='data', Split='train[:80%]') test = load_dataset('json', data_files='intents.json', field='data', Split='train[80%:]')   data = datasets.DatasetDict({"train":train, "test": test}) токенизированный = data.map(preprocess_func, пакетный = True) #data_collator = DefaultDataCollator() data_collator = DataCollatorForLanguageModeling(     tokenizer=токенизатор, mlm=True ) устройство = "процессор" модель = AutoModelForQuestionAnswering.from_pretrained('bert-base-uncased') модель = model.to(устройство) Training_args = TrainingArguments(   output_dir="./результаты",   Assessment_strategy="эпоха",   Learning_rate=2e-5,   per_device_train_batch_size = 2,   num_train_epochs=2,   вес_распад=0,01, ) тренер = Тренер(   модель = модель,   args=training_args,   train_dataset=токенизированный["поезд"],   токенизатор = токенизатор,   data_collator = data_collator, ) тренер.поезд()  и я получаю:
 
BertForQuestionAnswering.forward() получил неожиданный аргумент ключевого слова «метки»
 
но у меня нет меток в данных:
 
токенизированный DatasetDict({     поезд: Набор данных({         функции: ['контекст', 'id', 'вопрос', 'ответы', 'input_ids', 'token_type_ids', 'attention_mask'],         количество_строк: 2     })     тест: Набор данных({         функции: ['контекст', 'id', 'вопрос', 'ответы', 'input_ids', 'token_type_ids', 'attention_mask'],         количество_строк: 1     }) })  Если я использую:
 
DefaultDataCollator() вместо DataCollatorForLanguageModeling я получаю:
 
Модель не вернула потери из входных данных, а только следующие ключи: start_logits,end_logits
 
Я не уверен, что preprocess_func нужно еще что-то сделать.
 
Как, например, здесь
 def preprocess_function(примеры):     вопросы = [q.strip() для q в примерах["вопрос"]]     входы = токенизатор(         вопросы,         примеры["контекст"],         максимальная_длина = 512,         truncation="только_секунда",         return_offsets_mapping=Истина,         дополнение = "максимальная_длина",     )     offset_mapping = inputs.pop("offset_mapping")     ответы = примеры["ответы"]     start_positions = []     конечные_позиции = []     для i, смещение в перечислении (offset_mapping):         ответ = ответы[я]         start_char = ответ["ответ_старт"][0]         end_char = ответ["ответ_старт"][0] + len(ответ["текст"][0])         последовательность_ид = inputs.sequence_ids(i)         # Найдите начало и конец контекста         идентификатор = 0         в то время как последовательность_ids[idx] != 1:             идентификатор += 1         context_start = идентификатор         в то время как последовательность_ids[idx] == 1:             идентификатор += 1         context_end = идентификатор - 1         # Если ответ не полностью находится в контексте, пометьте его (0, 0)         if offset[context_start][0] > end_char или offset[context_end][1] < начальный_символ:             start_positions.append(0)             end_positions.append(0)         еще:             # В противном случае это начальная и конечная позиции токена             idx = начало_контекста             while idx = end_char:                 идентификатор -= 1             end_positions.append(idx + 1)     inputs["start_positions"] = start_positions     inputs["end_positions"] = конечные_позиции     возврат входных данных

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

ValueError: модель не вернула потерю из входных данных, но «модель» существует в «train_datasets columns_names»

Последнее сообщение Anonymous « 24 сен 2024, 09:25
Добавлено в форуме Python

Anonymous » 24 сен 2024, 09:25 » в форуме Python

Полная ошибка:
ValueError: The model did not return a loss from the inputs, only the following keys: logits. For reference, the inputs it received are input_ids,attention_mask.

Однако набор данных содержит метку, а train_dataset в аргументе имеет...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 09:25
ValueError: модель не вернула потерю из входных данных, но «модель» существует в «train_datasets columns_names»

Последнее сообщение Anonymous « 24 сен 2024, 12:41
Добавлено в форуме Python

Anonymous » 24 сен 2024, 12:41 » в форуме Python

Полная ошибка:
ValueError: The model did not return a loss from the inputs, only the following keys: logits. For reference, the inputs it received are input_ids,attention_mask.

Однако набор данных содержит метку, а train_dataset в аргументе имеет...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 12:41
Как использовать переменную из одного ключевого слова до другого ключевого слова в рамках робота

Последнее сообщение Anonymous « 28 янв 2025, 07:27
Добавлено в форуме Python

Anonymous » 28 янв 2025, 07:27 » в форуме Python

*** Keywords ***
JSON Object-Token
Create Session Portal ${portalUrlData}
${auth_token}= Evaluate Basic +***********************************'.encode('utf-8')).decode('utf-8')
${headers} Create Dictionary...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
28 янв 2025, 07:27
KeyInfoType() получил неожиданный аргумент ключевого слова «X509Data». Подпись:

Последнее сообщение Гость « 20 сен 2023, 19:44
Добавлено в форуме Python

Гость » 20 сен 2023, 19:44 » в форуме Python

Я использую Zeep для отправки XML-файла, но не могу его подписать, потому что постоянно получаю сообщение об ошибке: неожиданный аргумент keyowrd, но в документах явно есть x509Data

Singature-часть запроса

'Подпись': { 'SignedInfo': { 'Метод...

0 Ответы

102 Просмотры

Последнее сообщение Гость
20 сен 2023, 19:44
TypeError: __init__() получил неожиданный аргумент ключевого слова «firefox_profile» [закрыто]

Последнее сообщение Anonymous « 23 сен 2023, 06:23
Добавлено в форуме Python

Anonymous » 23 сен 2023, 06:23 » в форуме Python

У меня есть код Python для Instagram, но при запуске он всегда выдает эту ошибку Я запустил несколько установок, и эта ошибка всегда возвращается ко мне.

Ошибка типа: init () получил неожиданный аргумент ключевого слова «firefox_profile» ``

0 Ответы

111 Просмотры

Последнее сообщение Anonymous
23 сен 2023, 06:23

Вернуться в «Python»