Лама использует всю оперативную память, вызывая смерть ядра

Лама использует всю оперативную память, вызывая смерть ядра ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Лама использует всю оперативную память, вызывая смерть ядра

Цитата

Сообщение Anonymous » 18 ноя 2024, 16:53

import os
import torch
from datasets import load_dataset
from transformers import (
AutoModelForCausalLM,
AutoTokenizer,
BitsAndBytesConfig,
TrainingArguments,
pipeline,
logging,
)
from peft import LoraConfig
from trl import SFTTrainer

dataset = load_dataset("csv", data_files="dataset/data.csv")

base_model = "meta-llama/Llama-3.2-1B"
compute_dtype = getattr(torch, "float16")

# Configure memory-efficient quantization
compute_dtype = getattr(torch, "float16")
quant_config = BitsAndBytesConfig(
load_in_4bit=True,
bnb_4bit_quant_type="nf4",
bnb_4bit_compute_dtype=compute_dtype,
bnb_4bit_use_double_quant=True,  # Enable double quantization
)

model = AutoModelForCausalLM.from_pretrained(
base_model,
quantization_config=quant_config,
device_map="auto",  # Let transformers handle device mapping
torch_dtype=torch.float16,  # Use fp16 for model weights
low_cpu_mem_usage=True,    # Enable memory optimization
)

torch.cuda.empty_cache()
model.config.use_cache = False
model.config.pretraining_tp = 1

# Configure PEFT using LoRA for efficient fine-tuning of the model.
peft_params = LoraConfig(
lora_alpha=16,
lora_dropout=0.1,
r=8,
bias="none",
task_type="CAUSAL_LM",
target_modules="all-linear",
)

training_params = TrainingArguments(
output_dir="./results",
num_train_epochs=1,
per_device_train_batch_size=2,
gradient_accumulation_steps=2,
optim="paged_adamw_8bit",
save_steps=50,
logging_steps=50,
learning_rate=2e-4,
weight_decay=0.001,
fp16=True,
bf16=False,
max_grad_norm=0.3,
max_steps=-1,
warmup_ratio=0.03,
group_by_length=True,
lr_scheduler_type="constant",
report_to="tensorboard",
gradient_checkpointing=True,
)

tokenizer = AutoTokenizer.from_pretrained(
base_model,
padding_side="right",
truncation_side="right",
)
tokenizer.pad_token = tokenizer.eos_token

trainer = SFTTrainer(
model=model,
train_dataset=dataset['train'],
peft_config=peft_params,
dataset_text_field="input_text",
max_seq_length=512,
tokenizer=tokenizer,
args=training_params,
packing=False,
)

trainer.train()

Я использую приведенный выше блок кода для точной настройки параметров Llama 1-B с помощью моего компьютера с 128 ГБ ОЗУ и графическим процессором 4090. Соответственно, ПК соответствует всем требованиям модели, но при выполнении строки Trainer = SFTTrainer(....) оперативная память заполняется и ядро умирает, что неожиданно. Размер набора данных составляет всего 10 ГБ с 7400 строками данных. Буду рад, если кто-нибудь поможет мне решить эту проблему. Отслеживание ошибок выглядит следующим образом (используется вся память 128 ГБ, терминал выключается) -

Код: Выделить всё

Deprecated positional argument(s) used in SFTTrainer, please use the SFTConfig to set these arguments instead.
warnings.warn(message, FutureWarning)
/home/.../python3.10/site-packages/trl/trainer/sft_trainer.py:300: UserWarning: You passed a `max_seq_length` argument to the SFTTrainer, the value you passed will override the one in the `SFTConfig`.
warnings.warn(
/home/.../python3.10/site-packages/trl/trainer/sft_trainer.py:328: UserWarning: You passed a `dataset_text_field` argument to the SFTTrainer, the value you passed will override the one in the `SFTConfig`.
warnings.warn(
Map:  14%|██████████████████▍                                                                                                                    | 1000/7346 [02:59

Подробнее здесь: [url]https://stackoverflow.com/questions/79200200/llama-using-up-all-ram-storage-causing-kernel-to-die[/url]

1731937980

Anonymous

[code]import os
import torch
from datasets import load_dataset
from transformers import (
AutoModelForCausalLM,
AutoTokenizer,
BitsAndBytesConfig,
TrainingArguments,
pipeline,
logging,
)
from peft import LoraConfig
from trl import SFTTrainer

dataset = load_dataset("csv", data_files="dataset/data.csv")

base_model = "meta-llama/Llama-3.2-1B"
compute_dtype = getattr(torch, "float16")

# Configure memory-efficient quantization
compute_dtype = getattr(torch, "float16")
quant_config = BitsAndBytesConfig(
load_in_4bit=True,
bnb_4bit_quant_type="nf4",
bnb_4bit_compute_dtype=compute_dtype,
bnb_4bit_use_double_quant=True,  # Enable double quantization
)

model = AutoModelForCausalLM.from_pretrained(
base_model,
quantization_config=quant_config,
device_map="auto",  # Let transformers handle device mapping
torch_dtype=torch.float16,  # Use fp16 for model weights
low_cpu_mem_usage=True,    # Enable memory optimization
)

torch.cuda.empty_cache()
model.config.use_cache = False
model.config.pretraining_tp = 1

# Configure PEFT using LoRA for efficient fine-tuning of the model.
peft_params = LoraConfig(
lora_alpha=16,
lora_dropout=0.1,
r=8,
bias="none",
task_type="CAUSAL_LM",
target_modules="all-linear",
)

training_params = TrainingArguments(
output_dir="./results",
num_train_epochs=1,
per_device_train_batch_size=2,
gradient_accumulation_steps=2,
optim="paged_adamw_8bit",
save_steps=50,
logging_steps=50,
learning_rate=2e-4,
weight_decay=0.001,
fp16=True,
bf16=False,
max_grad_norm=0.3,
max_steps=-1,
warmup_ratio=0.03,
group_by_length=True,
lr_scheduler_type="constant",
report_to="tensorboard",
gradient_checkpointing=True,
)

tokenizer = AutoTokenizer.from_pretrained(
base_model,
padding_side="right",
truncation_side="right",
)
tokenizer.pad_token = tokenizer.eos_token

trainer = SFTTrainer(
model=model,
train_dataset=dataset['train'],
peft_config=peft_params,
dataset_text_field="input_text",
max_seq_length=512,
tokenizer=tokenizer,
args=training_params,
packing=False,
)

trainer.train()
[/code]
Я использую приведенный выше блок кода для точной настройки параметров Llama 1-B с помощью моего компьютера с 128 ГБ ОЗУ и графическим процессором 4090. Соответственно, ПК соответствует всем требованиям модели, но при выполнении строки Trainer = SFTTrainer(....) оперативная память заполняется и ядро умирает, что неожиданно. Размер набора данных составляет всего 10 ГБ с 7400 строками данных. Буду рад, если кто-нибудь поможет мне решить эту проблему. Отслеживание ошибок выглядит следующим образом (используется вся память 128 ГБ, терминал выключается) -
[code]Deprecated positional argument(s) used in SFTTrainer, please use the SFTConfig to set these arguments instead.
warnings.warn(message, FutureWarning)
/home/.../python3.10/site-packages/trl/trainer/sft_trainer.py:300: UserWarning: You passed a `max_seq_length` argument to the SFTTrainer, the value you passed will override the one in the `SFTConfig`.
warnings.warn(
/home/.../python3.10/site-packages/trl/trainer/sft_trainer.py:328: UserWarning: You passed a `dataset_text_field` argument to the SFTTrainer, the value you passed will override the one in the `SFTConfig`.
warnings.warn(
Map:  14%|██████████████████▍                                                                                                                    | 1000/7346 [02:59

Подробнее здесь: [url]https://stackoverflow.com/questions/79200200/llama-using-up-all-ram-storage-causing-kernel-to-die[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как я могу предотвратить этот код в полярах, чтобы потреблять всю оперативную память на моем компьютере?

Последнее сообщение Anonymous « 19 апр 2025, 02:13
Добавлено в форуме Python

Anonymous » 19 апр 2025, 02:13 » в форуме Python

Вопрос:
Я использую поляры для расчета показателей академической эффективности для учащихся в разных прошлых и текущих терминах. Моя текущая реализация включает в себя переход через каждый термин, что приводит к чрезмерному использованию памяти (до...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
19 апр 2025, 02:13
Xwayland постепенно потребляет всю оперативную память при запуске Tkkinter + matplotlib + rpi connect

Последнее сообщение Anonymous « 30 авг 2025, 01:30
Добавлено в форуме Python

Anonymous » 30 авг 2025, 01:30 » в форуме Python

У меня есть Raspberry Pi 4 (4 ГБ оперативной памяти), работая с программой Python 24/7. Эта программа использует TKINTER для графического интерфейса вдоль функции Matplotlib для обновления графиков. После запуска программы Python служба Xwayland...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
30 авг 2025, 01:30
Xwayland постепенно потребляет всю оперативную память при запуске Tkkinter + matplotlib + rpi connect

Последнее сообщение Anonymous « 31 авг 2025, 15:00
Добавлено в форуме Python

Anonymous » 31 авг 2025, 15:00 » в форуме Python

У меня есть Raspberry Pi 4 (4 ГБ оперативной памяти), работая с программой Python 24/7. Эта программа использует TKINTER для графического интерфейса вдоль функции Matplotlib для обновления графиков. После запуска программы Python служба Xwayland...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
31 авг 2025, 15:00
Xwayland постепенно потребляет всю оперативную память при запуске Tkkinter + matplotlib + rpi connect

Последнее сообщение Anonymous « 01 сен 2025, 00:26
Добавлено в форуме Python

Anonymous » 01 сен 2025, 00:26 » в форуме Python

У меня есть Raspberry Pi 4 (4 ГБ оперативной памяти), работая с программой Python 24/7. Эта программа использует TKINTER для графического интерфейса вдоль функции Matplotlib для обновления графиков. После запуска программы Python служба Xwayland...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
01 сен 2025, 00:26
В Debian (Kali) есть команда «график», позволяющая увидеть температуру, оперативную память, память и т. д.?

Последнее сообщение Anonymous « 17 янв 2025, 08:23
Добавлено в форуме Linux

Anonymous » 17 янв 2025, 08:23 » в форуме Linux

Я хочу видеть в реальном времени использование памяти, оперативной памяти, процессора и температуру на графике, например, как «net_graph» в CS 1.6. есть команда или программа, чтобы увидеть это?
Я использую Kali GNU/Linux kali-rolling 2024.4...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
17 янв 2025, 08:23

Вернуться в «Python»