Трансформатор ошибок с QLoRA и Peft

Трансформатор ошибок с QLoRA и Peft ⇐ Python

1 сообщение • Страница 1 из 1

Гость

Цитата

Сообщение Гость » 13 мар 2024, 20:29

Итак, я пытаюсь настроить модель Google Gemma, используя Peft и QLoRA. Вчера я успешно настроил его на одну эпоху просто в качестве теста. Однако, когда я сегодня открыл блокнот и запустил ячейку, загружающую модель, я получил огромную ошибку:
Код:

Код: Выделить всё

model_id = "google/gemma-7b"

bnb_config = BitsAndBytesConfig(
load_in_4bit=True,
bnb_4bit_use_double_quant=True,
bnb_4bit_quant_type="nf4",
bnb_4bit_compute_dtype=torch.bfloat16
)

tokenizer =
AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
quantization_config=bnb_config,
device_map={0:""})

#model.gradient_checkpointing_enable()

train_dataset, val_dataset, data_collator = load_dataset(train_data_path, val_data_path, tokenizer)

Ошибка (сокращенно):

Код: Выделить всё

RuntimeError: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at "../aten/src/ATen/cuda/CUDAContext.cpp":50, please report a bug to PyTorch. device=1, num_gpus=

.....

DeferredCudaCallError: CUDA call failed lazily at initialization with error: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at "../aten/src/ATen/cuda/CUDAContext.cpp":50, please report a bug to PyTorch. device=1, num_gpus=
.....

RuntimeError: Failed to import transformers.integrations.bitsandbytes because of the following error (look up to see its traceback):
CUDA call failed lazily at initialization with error: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at "../aten/src/ATen/cuda/CUDAContext.cpp":50, please report a bug to PyTorch. device=1, num_gpus=

.....

I have shortened the error for it to be more readable. Has anyone experienced something like this? I can't seem to solve it. Help is much appreciated.

Источник: https://stackoverflow.com/questions/781 ... a-and-peft

1710350995

Гость


Итак, я пытаюсь настроить модель Google Gemma, используя Peft и QLoRA. Вчера я успешно настроил его на одну эпоху просто в качестве теста. Однако, когда я сегодня открыл блокнот и запустил ячейку, загружающую модель, я получил огромную ошибку:
Код:
[code]model_id = "google/gemma-7b"

bnb_config = BitsAndBytesConfig(
load_in_4bit=True,
bnb_4bit_use_double_quant=True,
bnb_4bit_quant_type="nf4",
bnb_4bit_compute_dtype=torch.bfloat16
)

tokenizer =
AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
quantization_config=bnb_config,
device_map={0:""})

#model.gradient_checkpointing_enable()

train_dataset, val_dataset, data_collator = load_dataset(train_data_path, val_data_path, tokenizer)
[/code]
Ошибка (сокращенно):
[code]RuntimeError: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at "../aten/src/ATen/cuda/CUDAContext.cpp":50, please report a bug to PyTorch. device=1, num_gpus=

.....

DeferredCudaCallError: CUDA call failed lazily at initialization with error: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at "../aten/src/ATen/cuda/CUDAContext.cpp":50, please report a bug to PyTorch. device=1, num_gpus=
.....

RuntimeError: Failed to import transformers.integrations.bitsandbytes because of the following error (look up to see its traceback):
CUDA call failed lazily at initialization with error: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at "../aten/src/ATen/cuda/CUDAContext.cpp":50, please report a bug to PyTorch. device=1, num_gpus=

.....
[/code]
I have shortened the error for it to be more readable. Has anyone experienced something like this? I can't seem to solve it. Help is much appreciated.
 

Источник: [url]https://stackoverflow.com/questions/78155767/error-training-transformer-with-qlora-and-peft[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Библиотека PEFT установлена, но PEFT не определяется во время выполнения

Последнее сообщение Anonymous « 04 янв 2025, 08:35
Добавлено в форуме Python

Anonymous » 04 янв 2025, 08:35 » в форуме Python

Я пытаюсь построить модель ChemVLM ( При попытке запустить код Python я получаю сообщение об ошибке

ImportError: Для этого файла моделирования требуются следующие пакеты, которые не были найдены в вашей среде: peft. Запустите pip install peft

Но...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
04 янв 2025, 08:35
Сбой ядра при запуске TensorFlow с трансформаторами и моделью PEFT в Jupyter Notebook

Последнее сообщение Anonymous « 09 дек 2024, 13:44
Добавлено в форуме Python

Anonymous » 09 дек 2024, 13:44 » в форуме Python

Я работаю над Jupyter Notebook для проекта. Я использую TensorFlow и библиотеку Transformers с PEFT для текстовой модели. Когда я запускаю ноутбук, ядро выходит из строя вскоре после запуска. В журналах отображается предупреждение, связанное с...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 13:44
Возникает ошибка при точной настройке с использованием peft.

Последнее сообщение Anonymous « 12 дек 2024, 11:44
Добавлено в форуме Python

Anonymous » 12 дек 2024, 11:44 » в форуме Python

Я пытался выполнить точную настройку с помощью пефта. Ниже приведен мой код:
from peft import LoraConfig, TaskType, get_peft_model
from transformers import AutoModelForSeq2SeqLM
from transformers import AutoTokenizer, DataCollatorWithPadding
from...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 11:44
Как точно настроить большие языковые модели с использованием трансформаторов, peft и lora

Последнее сообщение Anonymous « 09 апр 2025, 13:13
Добавлено в форуме Python

Anonymous » 09 апр 2025, 13:13 » в форуме Python

Я новичок в ИИ. В настоящее время я пытаюсь точно настроить большую модель QWEN2.5-7B, используя алгоритм LORA с библиотекой PEFT и библиотекой Transforming Face. Код следующим образом:
from transformers import AutoModelForCausalLM, AutoTokenizer,...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
09 апр 2025, 13:13
Трансформатор кодер-декодер хорошая производительность обучения, плохая производительность авторегрессии

Последнее сообщение Anonymous « 22 июн 2024, 00:55
Добавлено в форуме Python

Anonymous » 22 июн 2024, 00:55 » в форуме Python

Я работаю над полной моделью преобразователя кодер-декодер для синтеза речи из сигналов ЭЭГ. В частности, для окна ЭЭГ-активности длиной x=100 я прогнозирую окно длиной x=100 мел-спектрограмм. ЭЭГ и мел-спектрограммы выровнены по времени, с общими...

0 Ответы

96 Просмотры

Последнее сообщение Anonymous
22 июн 2024, 00:55

Вернуться в «Python»