Я использую приведенный выше блок кода для точной настройки параметров Llama 1-B с помощью моего компьютера с 128 ГБ ОЗУ и графическим процессором 4090. Соответственно, ПК соответствует всем требованиям модели, но при выполнении строки Trainer = SFTTrainer(....) оперативная память заполняется и ядро умирает, что неожиданно. Размер набора данных составляет всего 10 ГБ с 7400 строками данных. Буду рад, если кто-нибудь поможет мне решить эту проблему. Отслеживание ошибок выглядит следующим образом (используется вся память 128 ГБ, терминал выключается) -
Deprecated positional argument(s) used in SFTTrainer, please use the SFTConfig to set these arguments instead.
warnings.warn(message, FutureWarning)
/home/.../python3.10/site-packages/trl/trainer/sft_trainer.py:300: UserWarning: You passed a `max_seq_length` argument to the SFTTrainer, the value you passed will override the one in the `SFTConfig`.
warnings.warn(
/home/.../python3.10/site-packages/trl/trainer/sft_trainer.py:328: UserWarning: You passed a `dataset_text_field` argument to the SFTTrainer, the value you passed will override the one in the `SFTConfig`.
warnings.warn(
Map: 14%|██████████████████▍ | 1000/7346 [02:59
Подробнее здесь: [url]https://stackoverflow.com/questions/79200200/llama-using-up-all-ram-storage-causing-kernel-to-die[/url]
model = AutoModelForCausalLM.from_pretrained( base_model, quantization_config=quant_config, device_map="auto", # Let transformers handle device mapping torch_dtype=torch.float16, # Use fp16 for model weights low_cpu_mem_usage=True, # Enable memory optimization )
trainer.train() [/code] Я использую приведенный выше блок кода для точной настройки параметров Llama 1-B с помощью моего компьютера с 128 ГБ ОЗУ и графическим процессором 4090. Соответственно, ПК соответствует всем требованиям модели, но при выполнении строки Trainer = SFTTrainer(....) оперативная память заполняется и ядро умирает, что неожиданно. Размер набора данных составляет всего 10 ГБ с 7400 строками данных. Буду рад, если кто-нибудь поможет мне решить эту проблему. Отслеживание ошибок выглядит следующим образом (используется вся память 128 ГБ, терминал выключается) - [code]Deprecated positional argument(s) used in SFTTrainer, please use the SFTConfig to set these arguments instead. warnings.warn(message, FutureWarning) /home/.../python3.10/site-packages/trl/trainer/sft_trainer.py:300: UserWarning: You passed a `max_seq_length` argument to the SFTTrainer, the value you passed will override the one in the `SFTConfig`. warnings.warn( /home/.../python3.10/site-packages/trl/trainer/sft_trainer.py:328: UserWarning: You passed a `dataset_text_field` argument to the SFTTrainer, the value you passed will override the one in the `SFTConfig`. warnings.warn( Map: 14%|██████████████████▍ | 1000/7346 [02:59