Llama 3: получение неизвестной ошибки CUDA при точной настройке Llama 3 в викитексте

Llama 3: получение неизвестной ошибки CUDA при точной настройке Llama 3 в викитексте ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Llama 3: получение неизвестной ошибки CUDA при точной настройке Llama 3 в викитексте

Цитата

Сообщение Anonymous » 19 янв 2025, 16:46

Я новичок в больших языковых моделях и API Hugging Face. В качестве практики я пытался настроить модель Llama 3.1 8b на наборе данных викитекста.
Когда я пытаюсь запустить следующий скрипт, я получаю неизвестную ошибку CUDA.

Код: Выделить всё

CUDA error: unknown error
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.
File "/root/mesh_LLM.py", line 84, in 
trainer.train()
RuntimeError: CUDA error: unknown error
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.

Моя машина серии Dell Precision с 16 ГБ видеопамяти NVIDIA RTX A5000, поэтому я надеюсь, что это не проблема с памятью, учитывая, что я загружаю и настраиваю модель с точностью до 8 бит.
Вот код:

Код: Выделить всё

import torch,os
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers import Trainer, TrainingArguments, BitsAndBytesConfig
from datasets import load_dataset
from peft import LoraConfig, get_peft_model

os.environ['CUDA_LAUNCH_BLOCKING'] = '1'
model_name = "meta-llama/Llama-3.1-8b"

tokenizer = AutoTokenizer.from_pretrained(base_model_id, token='hf-****')
tokenizer.pad_token = tokenizer.eos_token
model = AutoModelForCausalLM.from_pretrained(base_model_id, device_map='auto', load_in_8bit=True)
model.resize_token_embeddings(len(tokenizer))

peft_config = LoraConfig(r=16, lora_alpha=32, lora_dropout=0.05, bias='none', task_type="CAUSAL_LM")
model = get_peft_model(model, peft_config)

model.print_trainable_parameters()

# Load a dataset
dataset = load_dataset("wikitext", "wikitext-2-raw-v1")

# Tokenize the dataset
def tokenize_function(examples):
return tokenizer(examples["text"], padding="max_length", truncation=True, max_length=512)

tokenized_datasets = dataset.map(tokenize_function, batched=True)

training_args = TrainingArguments(
output_dir="./llama3_finetuned",  # Where to save the model
evaluation_strategy="steps",     # Evaluate during training
save_strategy="steps",           # Save checkpoints
learning_rate=2e-5,              # A good starting point for fine-tuning
per_device_train_batch_size=4,   # Adjust based on GPU memory
gradient_accumulation_steps=8,   # Simulates a larger batch size
num_train_epochs=3,              # Experiment with more epochs for small datasets
logging_steps=100,               # Log training progress
save_steps=500,                  # Save model every 500 steps
push_to_hub=False                # Skip pushing to Hugging Face Hub for now
)

trainer = Trainer(
model=model,
train_dataset=tokenized_datasets['train'],
eval_dataset=tokenized_datasets['validation'],
tokenizer=tokenizer,
args=training_args
)

trainer.train()
trainer.save_model('model_ft/fine_tuned_llama3-8B')

Любые предложения будут очень полезны!

Подробнее здесь: https://stackoverflow.com/questions/793 ... n-wikitext

1737294406

Anonymous

Я новичок в больших языковых моделях и API Hugging Face. В качестве практики я пытался настроить модель Llama 3.1 8b на наборе данных викитекста.
Когда я пытаюсь запустить следующий скрипт, я получаю неизвестную ошибку CUDA.[code]CUDA error: unknown error
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.
File "/root/mesh_LLM.py", line 84, in 
trainer.train()
RuntimeError: CUDA error: unknown error
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.
[/code]
Моя машина серии Dell Precision с 16 ГБ видеопамяти NVIDIA RTX A5000, поэтому я надеюсь, что это не проблема с памятью, учитывая, что я загружаю и настраиваю модель с точностью до 8 бит. 
Вот код:
[code]import torch,os
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers import Trainer, TrainingArguments, BitsAndBytesConfig
from datasets import load_dataset
from peft import LoraConfig, get_peft_model

os.environ['CUDA_LAUNCH_BLOCKING'] = '1'
model_name = "meta-llama/Llama-3.1-8b"

tokenizer = AutoTokenizer.from_pretrained(base_model_id, token='hf-****')
tokenizer.pad_token = tokenizer.eos_token
model = AutoModelForCausalLM.from_pretrained(base_model_id, device_map='auto', load_in_8bit=True)
model.resize_token_embeddings(len(tokenizer))

peft_config = LoraConfig(r=16, lora_alpha=32, lora_dropout=0.05, bias='none', task_type="CAUSAL_LM")
model = get_peft_model(model, peft_config)

model.print_trainable_parameters()

# Load a dataset
dataset = load_dataset("wikitext", "wikitext-2-raw-v1")

# Tokenize the dataset
def tokenize_function(examples):
return tokenizer(examples["text"], padding="max_length", truncation=True, max_length=512)

tokenized_datasets = dataset.map(tokenize_function, batched=True)

training_args = TrainingArguments(
output_dir="./llama3_finetuned",  # Where to save the model
evaluation_strategy="steps",     # Evaluate during training
save_strategy="steps",           # Save checkpoints
learning_rate=2e-5,              # A good starting point for fine-tuning
per_device_train_batch_size=4,   # Adjust based on GPU memory
gradient_accumulation_steps=8,   # Simulates a larger batch size
num_train_epochs=3,              # Experiment with more epochs for small datasets
logging_steps=100,               # Log training progress
save_steps=500,                  # Save model every 500 steps
push_to_hub=False                # Skip pushing to Hugging Face Hub for now
)

trainer = Trainer(
model=model,
train_dataset=tokenized_datasets['train'],
eval_dataset=tokenized_datasets['validation'],
tokenizer=tokenizer,
args=training_args
)

trainer.train()
trainer.save_model('model_ft/fine_tuned_llama3-8B')
[/code]
Любые предложения будут очень полезны! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79368955/llama-3-getting-a-cuda-unknown-error-while-fine-tuning-llama-3-on-wikitext[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Llama 3: получение неизвестной ошибки CUDA при точной настройке Llama 3 в викитексте

Последнее сообщение Anonymous « 19 янв 2025, 15:40
Добавлено в форуме Python

Anonymous » 19 янв 2025, 15:40 » в форуме Python

Я новичок в больших языковых моделях и API Hugging Face. В качестве практики я пытался настроить модель Llama 3.1 8b на наборе данных викитекста.
Когда я пытаюсь запустить следующий скрипт, я получаю неизвестную ошибку CUDA. CUDA error: unknown...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
19 янв 2025, 15:40
Как исправить ошибку «Утверждение `srcIndex < srcSelectDimSize` не удалось» при точной настройке LLaMA 3?

Последнее сообщение Anonymous « 29 июн 2024, 10:30
Добавлено в форуме Python

Anonymous » 29 июн 2024, 10:30 » в форуме Python

Предисловие
Я пытаюсь точно настроить LLaMA, добавив слой классификации сверху с помощью AutoModelForSequenceClassification. Я настроил его для задачи двоичной классификации.
Реализация

Исходный набор данных

Dataset({
features: ,
num_rows:...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
29 июн 2024, 10:30
Ошибка выполнения: патрон ожидает как минимум одномерный тензор при точной настройке Llama с использованием трансформато

Последнее сообщение Anonymous « 09 дек 2024, 19:51
Добавлено в форуме Python

Anonymous » 09 дек 2024, 19:51 » в форуме Python

Я настраиваю модель Llama-3.2-3B-Instruct с помощью специального набора данных. Сценарий обучения работает на одном графическом процессоре (возможно, из-за нехватки памяти), но завершается с ошибкой RuntimeError: чанк ожидает как минимум одномерный...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 19:51
Получение ошибки «Бэкенд CUDA требует cuDNN» при настройке сборки OpenCV cmake с включенным бэкэндом cuda.

Последнее сообщение Anonymous « 25 июн 2024, 16:51
Добавлено в форуме C++

Anonymous » 25 июн 2024, 16:51 » в форуме C++

Моя цель:
Моя цель — настроить сборку OpenCV 4.5.1-dev с поддержкой cuda, tesseract и QT без каких-либо ошибок cmake..У меня возникла проблема:
Когда я нажимаю кнопку настройки в графическом интерфейсе cmake, я получаю следующую ошибку:
CMake Error...

0 Ответы

54 Просмотры

Последнее сообщение Anonymous
25 июн 2024, 16:51
Как изменить набор данных при точной настройке модели Whisper?

Последнее сообщение Anonymous « 04 мар 2024, 11:35
Добавлено в форуме Python

Anonymous » 04 мар 2024, 11:35 » в форуме Python

I tried to fine-tune the Whisper model by referring to the article. If want to refer to the code, please look at the colab link.

All I want to do is change the common-voice dataset used in the article to my dataset.

I use a prepared common-voice...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
04 мар 2024, 11:35

Вернуться в «Python»