Почему у моей тонкой настройки модели T5-базы для задачи последовательности к последовательности была короткая неполная

Почему у моей тонкой настройки модели T5-базы для задачи последовательности к последовательности была короткая неполная ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Почему у моей тонкой настройки модели T5-базы для задачи последовательности к последовательности была короткая неполная

Цитата

Сообщение Anonymous » 06 май 2025, 13:01

Я пытаюсь точно настроить модель t5-base для создания соответствующего вопроса против элемента соответствия. Соответствие ITEAM - это абзац текстов, и мой вопрос - в прошлом формате их. Я обучил модель, сохранил ее и загрузил ее обратно для будущих пользователей.import pandas as pd
import torch
from datasets import Dataset
import transformers
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, Seq2SeqTrainingArguments, Seq2SeqTrainer, T5Tokenizer

df = pd.read_csv(r'/content/questionsgenerator.csv', encoding='unicode_escape')
df.head()

# Load pre-trained model and tokenizer
model_name = "t5-base"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

# Define the training arguments
training_args = Seq2SeqTrainingArguments(
output_dir="./output_dir",
per_device_train_batch_size=8,
per_device_eval_batch_size=8,
predict_with_generate=True,
logging_steps=100,
save_steps=5000,
eval_steps=5000,
num_train_epochs=3,
learning_rate=1e-4,
warmup_steps=1000,
save_total_limit=3,
)

# Define the training dataset
train_dataset = Dataset.from_pandas(df.rename(columns={"Compliance Item": "input_text", "Question": "target_text"}))

# Define the function to preprocess the dataset
def preprocess_function(examples):
inputs = [f"compliance item: {ci}" for ci in examples["input_text"]]
targets = [f"{question} " for question in examples["target_text"]]
model_inputs = tokenizer(inputs, max_length=512, padding="max_length", truncation=True)
with tokenizer.as_target_tokenizer():
labels = tokenizer(targets, max_length=32, padding="max_length", truncation=True)
model_inputs["labels"] = labels["input_ids"]
return model_inputs

# Preprocess the dataset
train_dataset = train_dataset.map(preprocess_function, batched=True)

# Define the trainer
trainer = Seq2SeqTrainer(
model=model,
args=training_args,
train_dataset=train_dataset,
)

# Fine-tune the model on the dataset
trainer.train()

model.save_pretrained("./fine_tuned_model_question_generation")

tokenizer = T5Tokenizer.from_pretrained("t5-large")
model = transformers.AutoModelForSeq2SeqLM.from_pretrained("./fine_tuned_model_question_generation")

context = 'When the Installment Due Date falls on a non-business day, the Mortgagee must consider a Borrower’s Notice of Intent to Prepay or the receipt of the prepayment amount for a Mortgage closed before January 21, 2015 timely if received on the next business day.'

encoding = tokenizer.encode_plus(context, return_tensors="pt")

input_ids = encoding["input_ids"]
attention_mask = encoding["attention_mask"]

output = model.generate(input_ids=input_ids, attention_mask=attention_mask, max_length=1000)
decoded_output = tokenizer.decode(output[0], skip_special_tokens=True)

decoded_output
< /code>
Здесь ответ:
When the Installment Due Date fell on a non-business day, was the Borrower’s Notice of Intent to Prepay or the receipt of the prepayment amount for< /code>
, что, очевидно, неполное.>

Подробнее здесь: https://stackoverflow.com/questions/784 ... as-short-i

1746525660

Anonymous

 Я пытаюсь точно настроить модель t5-base  для создания соответствующего вопроса против элемента соответствия. Соответствие ITEAM - это абзац текстов, и мой вопрос - в прошлом формате их. Я обучил модель, сохранил ее и загрузил ее обратно для будущих пользователей.import pandas as pd
import torch
from datasets import Dataset
import transformers
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, Seq2SeqTrainingArguments, Seq2SeqTrainer, T5Tokenizer

df = pd.read_csv(r'/content/questionsgenerator.csv', encoding='unicode_escape')
df.head()

# Load pre-trained model and tokenizer
model_name = "t5-base"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

# Define the training arguments
training_args = Seq2SeqTrainingArguments(
output_dir="./output_dir",
per_device_train_batch_size=8,
per_device_eval_batch_size=8,
predict_with_generate=True,
logging_steps=100,
save_steps=5000,
eval_steps=5000,
num_train_epochs=3,
learning_rate=1e-4,
warmup_steps=1000,
save_total_limit=3,
)

# Define the training dataset
train_dataset = Dataset.from_pandas(df.rename(columns={"Compliance Item": "input_text", "Question": "target_text"}))

# Define the function to preprocess the dataset
def preprocess_function(examples):
inputs = [f"compliance item: {ci}" for ci in examples["input_text"]]
targets = [f"{question} " for question in examples["target_text"]]
model_inputs = tokenizer(inputs, max_length=512, padding="max_length", truncation=True)
with tokenizer.as_target_tokenizer():
labels = tokenizer(targets, max_length=32, padding="max_length", truncation=True)
model_inputs["labels"] = labels["input_ids"]
return model_inputs

# Preprocess the dataset
train_dataset = train_dataset.map(preprocess_function, batched=True)

# Define the trainer
trainer = Seq2SeqTrainer(
model=model,
args=training_args,
train_dataset=train_dataset,
)

# Fine-tune the model on the dataset
trainer.train()

model.save_pretrained("./fine_tuned_model_question_generation")

tokenizer = T5Tokenizer.from_pretrained("t5-large")
model = transformers.AutoModelForSeq2SeqLM.from_pretrained("./fine_tuned_model_question_generation")

context = 'When the Installment Due Date falls on a non-business day, the Mortgagee must consider a Borrower’s Notice of Intent to Prepay or the receipt of the prepayment amount for a Mortgage closed before January 21, 2015 timely if received on the next business day.'

encoding = tokenizer.encode_plus(context, return_tensors="pt")

input_ids = encoding["input_ids"]
attention_mask = encoding["attention_mask"]

output = model.generate(input_ids=input_ids, attention_mask=attention_mask, max_length=1000)
decoded_output = tokenizer.decode(output[0], skip_special_tokens=True)

decoded_output
< /code>
Здесь ответ:
When the Installment Due Date fell on a non-business day, was the Borrower’s Notice of Intent to Prepay or the receipt of the prepayment amount for< /code>
, что, очевидно, неполное.> 

Подробнее здесь: [url]https://stackoverflow.com/questions/78448914/why-did-my-fine-tuning-t5-base-model-for-a-sequence-to-sequence-task-has-short-i[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Генерирование частичной строки в качестве выходного сигнала после тонкой настройки модели T5

Последнее сообщение Гость « 13 май 2025, 10:04
Добавлено в форуме Python

Гость » 13 май 2025, 10:04 » в форуме Python

Я использую тонкую модель T5 для выполнения проверки орфографии в моем наборе данных, состоящей из обзоров. Тем не менее, я сталкиваюсь с проблемой, в которой модель при выполнении проверки орфографии не дает целой строки в виде вывода или иногда...

0 Ответы

4 Просмотры

Последнее сообщение Гость
13 май 2025, 10:04
Генерирование частичной строки в качестве выходного сигнала после тонкой настройки модели T5

Последнее сообщение Anonymous « 25 май 2025, 13:07
Добавлено в форуме Python

Anonymous » 25 май 2025, 13:07 » в форуме Python

Я использую тонкую модель T5 для выполнения проверки орфографии в моем наборе данных, состоящей из обзоров. Тем не менее, я сталкиваюсь с проблемой, в которой модель при выполнении проверки орфографии не дает целой строки в виде вывода или иногда...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
25 май 2025, 13:07
Генерирование частичной строки в качестве выходного сигнала после тонкой настройки модели T5

Последнее сообщение Anonymous « 25 май 2025, 13:07
Добавлено в форуме Python

Anonymous » 25 май 2025, 13:07 » в форуме Python

Я использую тонкую модель T5 для выполнения проверки орфографии в моем наборе данных, состоящей из обзоров. Тем не менее, я сталкиваюсь с проблемой, в которой модель при выполнении проверки орфографии не дает целой строки в виде вывода или иногда...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
25 май 2025, 13:07
Конфигурация тонкой настройки звука для небольшого набора данных

Последнее сообщение Anonymous « 16 ноя 2024, 15:03
Добавлено в форуме Python

Anonymous » 16 ноя 2024, 15:03 » в форуме Python

Я новичок в обучении данных, особенно в области точной настройки. Я хочу попробовать сделать точную настройку аудиоданных с помощью vits Finetuning с небольшим набором данных под 100 аудиофайлов длительностью менее 10 с каждый, и вот в чем проблема,...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
16 ноя 2024, 15:03
Конфигурация тонкой настройки звука для небольшого набора данных

Последнее сообщение Anonymous « 16 ноя 2024, 17:27
Добавлено в форуме Python

Anonymous » 16 ноя 2024, 17:27 » в форуме Python

Я новичок в обучении данных, особенно в области точной настройки. Я хочу попробовать сделать точную настройку аудиоданных с помощью витов с небольшим набором данных под 100 аудиофайлов по 10 с каждый, и вот в чем проблема, я уже пробовал...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
16 ноя 2024, 17:27

Вернуться в «Python»