Не в состоянии генерировать выход на определенных обзорах с помощью модели Fine-TunePython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Не в состоянии генерировать выход на определенных обзорах с помощью модели Fine-Tune

Сообщение Anonymous »

Я использую T5, текстовую модель для выполнения проверки орфографии в данном наборе данных, состоящем из обзоров. Модель точно настроена в 2 итерациях 20 тыс. Обзоров и 40 тыс. Обзоров каждый. потери обучения и потери проверки во всем этом процессе были 0,0003 и 0,000052 соответственно.
Теперь после этого я применил это в списке образцов из 20 обзоров, чтобы вручную проверить ее производительность, которая была достаточно приличной, но применительно к DataSet, что больше, чем на 14K, не показывают, что на 1K. ?

Код: Выделить всё

class ReviewDataset(Dataset):
def __init__(self, texts):
self.inputs = ["fix: " + text for text in texts]

def __len__(self):
return len(self.inputs)

def __getitem__(self, idx):
return self.inputs[idx]

def collate_fn(batch):
encodings = tokenizer(
batch,
padding=True,
truncation=True,
max_length=128,
return_tensors="pt"
)
return encodings
< /code>
Я реализовал это путем переработки пакетов < /p>
    df = pd.read_csv("reviews.csv",encoding="latin-1")
dataset = ReviewDataset(df["review_text"].tolist())
dataloader = DataLoader(dataset, batch_size=256, collate_fn=collate_fn)

all_predictions = []

with torch.no_grad():
for batch in dataloader:
input_ids = batch["input_ids"].to(device)
attention_mask = batch["attention_mask"].to(device)

outputs = model.generate(input_ids=input_ids, attention_mask=attention_mask, max_length=64)
decoded = tokenizer.batch_decode(outputs, skip_special_tokens=True)
all_predictions.extend(decoded)

df["corrected_review"] = all_predictions
df.to_csv("corrected_reviews_batched.csv", index=False)
Как это исправить?

Подробнее здесь: https://stackoverflow.com/questions/796 ... tune-model
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • LLM Fine Tune — точность проверки намного выше точности тестирования.
    Anonymous » » в форуме Python
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous
  • Выход, выход(), выход(0), die(), die(0) - Как выйти из скрипта
    Anonymous » » в форуме Php
    0 Ответы
    63 Просмотры
    Последнее сообщение Anonymous
  • Pytorch + Ray Tune сообщает, что ImplicitFunc слишком велик, не знаю, какая ссылка велика
    Anonymous » » в форуме Python
    0 Ответы
    11 Просмотры
    Последнее сообщение Anonymous
  • Pytorch + Ray Tune сообщает, что ImplicitFunc слишком велик, не знаю, какая ссылка велика
    Anonymous » » в форуме Python
    0 Ответы
    7 Просмотры
    Последнее сообщение Anonymous
  • Ray.tune: отслеживаемый актер не управляется
    Anonymous » » в форуме Python
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»