Не удалось сгенерировать ответ после точной настройки Bloomz-560M с помощью LoRA.

Не удалось сгенерировать ответ после точной настройки Bloomz-560M с помощью LoRA. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Не удалось сгенерировать ответ после точной настройки Bloomz-560M с помощью LoRA.

Цитата

Сообщение Anonymous » 03 окт 2024, 15:24

У меня возникли проблемы при создании диалога после точной настройки Bloomz-560m с помощью LoRA.
Во время обучения кажется, что все в порядке, но при генерации выдается сообщение «IndexError: индекс кортежа вне диапазона». ответы. Кроме того, модель больше не могла работать, какие бы входные данные я ни предоставлял.
Вот мой код:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
from peft import LoraConfig, get_peft_model, TaskType
from torch.utils.data import Dataset
from transformers import Trainer, TrainingArguments

MODEL_NAME = "bigscience/bloomz-560m"
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
lora_config = LoraConfig(
task_type=TaskType.CAUSAL_LM,
inference_mode=False,
r=8,
lora_alpha=16,
lora_dropout=0.1
)

model = get_peft_model(model, lora_config)
class CustomDataset(Dataset):
def __init__(self, input_texts):
self.input_texts = input_texts

def __len__(self):
return len(self.input_texts)

def __getitem__(self, idx):
input_text = self.input_texts[idx]
# Tokenization
encoding = tokenizer(input_text, return_tensors="pt", padding=True, truncation=True)
# Include labels
encoding["labels"] = encoding["input_ids"]
return {key: val.squeeze() for key, val in encoding.items()}

input_texts = [
"Convesation 1:\nQ: 請問什麼是性騷擾？\nA: 性騷擾是指任何不受歡迎的性相關行為...",
"Convesation 2:\nQ: 如何避免性行為帶來的風險？\nA: 為了避免性行為帶來的健康風險...",
"Convesation 3:\nQ: 為什麼性教育對青少年很重要？\nA: 性教育對青少年來說很重要..."
]
dataset = CustomDataset(input_texts)
training_args = TrainingArguments(
output_dir="./lora_bloomz_finetuned",
per_device_train_batch_size=1,
num_train_epochs=3,
learning_rate=2e-5,
logging_steps=10,
save_steps=50,
save_total_limit=2,
report_to="none"
)
trainer = Trainer(
model=model,
args=training_args,
train_dataset=dataset
)

trainer.train()
test_prompt = "Q: 什麼是避孕套的作用？\nA:"
inputs = tokenizer(test_prompt, return_tensors="pt").to(model.device)
output = model.generate(**inputs, max_length=100)
print(tokenizer.decode(output[0], skip_special_tokens=True))

Сообщение об ошибке:
IndexError Traceback (most recent call last)
Cell In[10], line 3
1 test_prompt = "Q: 什麼是避孕套的作用？\nA:"
2 inputs = tokenizer(test_prompt, return_tensors="pt").to(model.device)
----> 3 output = model.generate(**inputs, max_length=100)
4 print(tokenizer.decode(output[0], skip_special_tokens=True))

File ~/Desktop/sex-edu-chatbot/.venv/lib/python3.10/site-packages/peft/peft_model.py:1704, in PeftModelForCausalLM.generate(self, *args, **kwargs)
1702 with self._enable_peft_forward_hooks(*args, **kwargs):
1703 kwargs = {k: v for k, v in kwargs.items() if k not in self.special_peft_forward_args}
-> 1704 outputs = self.base_model.generate(*args, **kwargs)
1705 else:
1706 outputs = self.base_model.generate(**kwargs)

File ~/Desktop/sex-edu-chatbot/.venv/lib/python3.10/site-packages/torch/utils/_contextlib.py:115, in context_decorator..decorate_context(*args, **kwargs)
112 @functools.wraps(func)
113 def decorate_context(*args, **kwargs):
114 with ctx_factory():
--> 115 return func(*args, **kwargs)

File ~/Desktop/sex-edu-chatbot/.venv/lib/python3.10/site-packages/transformers/generation/utils.py:1829, in GenerationMixin.generate(self, inputs, generation_config, logits_processor, stopping_criteria, prefix_allowed_tokens_fn, synced_gpus, assistant_model, streamer, negative_prompt_ids, negative_prompt_attention_mask, **kwargs)
1826 batch_size = inputs_tensor.shape[0]
1828 device = inputs_tensor.device
-> 1829 self._prepare_special_tokens(generation_config, kwargs_has_attention_mask, device=device)
...
326 else:
327 # Note: don't use named arguments in `torch.isin`, see https://github.com/pytorch/pytorch/issues/126045
328 return torch.isin(elements, test_elements)

IndexError: tuple index out of range```

I tried using different input data, but it doesn't work.
And the pretrained model originally could translate conversation, but it could not do it after finetuning.

Подробнее здесь: https://stackoverflow.com/questions/790 ... -with-lora

1727958286

Anonymous

У меня возникли проблемы при создании диалога после точной настройки Bloomz-560m с помощью LoRA.
Во время обучения кажется, что все в порядке, но при генерации выдается сообщение «IndexError: индекс кортежа вне диапазона». ответы. Кроме того, модель больше не могла работать, какие бы входные данные я ни предоставлял.
Вот мой код:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
from peft import LoraConfig, get_peft_model, TaskType
from torch.utils.data import Dataset
from transformers import Trainer, TrainingArguments

MODEL_NAME = "bigscience/bloomz-560m"
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
lora_config = LoraConfig(
task_type=TaskType.CAUSAL_LM,
inference_mode=False,
r=8,
lora_alpha=16,
lora_dropout=0.1
)

model = get_peft_model(model, lora_config)
class CustomDataset(Dataset):
def __init__(self, input_texts):
self.input_texts = input_texts

def __len__(self):
return len(self.input_texts)

def __getitem__(self, idx):
input_text = self.input_texts[idx]
# Tokenization
encoding = tokenizer(input_text, return_tensors="pt", padding=True, truncation=True)
# Include labels
encoding["labels"] = encoding["input_ids"]
return {key: val.squeeze() for key, val in encoding.items()}

input_texts = [
"Convesation 1:\nQ: 請問什麼是性騷擾？\nA: 性騷擾是指任何不受歡迎的性相關行為...",
"Convesation 2:\nQ: 如何避免性行為帶來的風險？\nA: 為了避免性行為帶來的健康風險...",
"Convesation 3:\nQ: 為什麼性教育對青少年很重要？\nA: 性教育對青少年來說很重要..."
]
dataset = CustomDataset(input_texts)
training_args = TrainingArguments(
output_dir="./lora_bloomz_finetuned",
per_device_train_batch_size=1,
num_train_epochs=3,
learning_rate=2e-5,
logging_steps=10,
save_steps=50,
save_total_limit=2,
report_to="none"
)
trainer = Trainer(
model=model,
args=training_args,
train_dataset=dataset
)

trainer.train()
test_prompt = "Q: 什麼是避孕套的作用？\nA:"
inputs = tokenizer(test_prompt, return_tensors="pt").to(model.device)
output = model.generate(**inputs, max_length=100)
print(tokenizer.decode(output[0], skip_special_tokens=True))

Сообщение об ошибке:
IndexError                                Traceback (most recent call last)
Cell In[10], line 3
1 test_prompt = "Q: 什麼是避孕套的作用？\nA:"
2 inputs = tokenizer(test_prompt, return_tensors="pt").to(model.device)
----> 3 output = model.generate(**inputs, max_length=100)
4 print(tokenizer.decode(output[0], skip_special_tokens=True))

File ~/Desktop/sex-edu-chatbot/.venv/lib/python3.10/site-packages/peft/peft_model.py:1704, in PeftModelForCausalLM.generate(self, *args, **kwargs)
1702     with self._enable_peft_forward_hooks(*args, **kwargs):
1703         kwargs = {k: v for k, v in kwargs.items() if k not in self.special_peft_forward_args}
-> 1704         outputs = self.base_model.generate(*args, **kwargs)
1705 else:
1706     outputs = self.base_model.generate(**kwargs)

File ~/Desktop/sex-edu-chatbot/.venv/lib/python3.10/site-packages/torch/utils/_contextlib.py:115, in context_decorator..decorate_context(*args, **kwargs)
112 @functools.wraps(func)
113 def decorate_context(*args, **kwargs):
114     with ctx_factory():
--> 115         return func(*args, **kwargs)

File ~/Desktop/sex-edu-chatbot/.venv/lib/python3.10/site-packages/transformers/generation/utils.py:1829, in GenerationMixin.generate(self, inputs, generation_config, logits_processor, stopping_criteria, prefix_allowed_tokens_fn, synced_gpus, assistant_model, streamer, negative_prompt_ids, negative_prompt_attention_mask, **kwargs)
1826 batch_size = inputs_tensor.shape[0]
1828 device = inputs_tensor.device
-> 1829 self._prepare_special_tokens(generation_config, kwargs_has_attention_mask, device=device)
...
326 else:
327     # Note: don't use named arguments in `torch.isin`, see https://github.com/pytorch/pytorch/issues/126045
328     return torch.isin(elements, test_elements)

IndexError: tuple index out of range```

I tried using different input data, but it doesn't work.
And the pretrained model originally could translate conversation, but it could not do it after finetuning.
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79049349/could-not-generate-answer-after-finetuning-bloomz-560m-with-lora[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Не удалось сгенерировать ответ после точной настройки Bloomz-560M с помощью LoRA.

Последнее сообщение Anonymous « 03 окт 2024, 09:24
Добавлено в форуме Python

Anonymous » 03 окт 2024, 09:24 » в форуме Python

У меня возникли проблемы при создании диалога после точной настройки Bloomz-560m с помощью LoRA.
Во время обучения кажется, что все в порядке, но при генерации выдается сообщение «IndexError: индекс кортежа вне диапазона». ответы. Кроме того, модель...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 09:24
Проблемы во время тонкой настройки LoRA: получены неожиданные аргументы: {'num_items_in_batch': 8192}

Последнее сообщение Anonymous « 30 дек 2024, 06:52
Добавлено в форуме Python

Anonymous » 30 дек 2024, 06:52 » в форуме Python

Я экспериментирую с LoRA, чтобы точно настроить модель для обработки и анализа PDF-файлов, чтобы можно было задавать вопросы на основе этих файлов. По сути, я загружал PDF-файлы, затем программа разбивала их на куски и «училась» на PDF-файлах, чтобы...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
30 дек 2024, 06:52
Проблемы во время тонкой настройки LoRA: получены неожиданные аргументы: {'num_items_in_batch': 8192}

Последнее сообщение Anonymous « 30 дек 2024, 15:44
Добавлено в форуме Python

Anonymous » 30 дек 2024, 15:44 » в форуме Python

Я экспериментирую с LoRA, чтобы точно настроить модель для обработки и анализа PDF-файлов, чтобы можно было задавать вопросы на основе этих файлов. По сути, я загружал PDF-файлы, затем программа разбивала их на куски и «училась» на PDF-файлах, чтобы...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
30 дек 2024, 15:44
Чтение пользовательского набора данных COCO для точной настройки

Последнее сообщение Гость « 22 сен 2023, 10:55
Добавлено в форуме Python

Гость » 22 сен 2023, 10:55 » в форуме Python

У меня есть задача по обнаружению объектов, для которой я подготовил изображения и аннотации*. Изображения (PNG) хранятся в той же папке, где хранятся аннотации COCO json. В аннотациях json используется формат COCO для обнаружения объектов:

info...

0 Ответы

37 Просмотры

Последнее сообщение Гость
22 сен 2023, 10:55
IndexError при создании экземпляра SFTTrainer() для точной настройки Llama2.

Последнее сообщение Anonymous « 29 окт 2023, 19:26
Добавлено в форуме Python

Anonymous » 29 окт 2023, 19:26 » в форуме Python

Я новичок в НЛП и просматриваю руководство по точной настройке Llama2. Я следовал инструкциям, и это сработало хорошо, но я столкнулся с ошибкой IndexError, когда пытался создать экземпляр SFTTrainer() для обучения моей модели. Прежде чем я...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
29 окт 2023, 19:26

Вернуться в «Python»