Оценка тренера Трансформеров занимает вечность

Оценка тренера Трансформеров занимает вечность ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Оценка тренера Трансформеров занимает вечность

Цитата

Сообщение Anonymous » 29 фев 2024, 18:41

Я пытаюсь создать личный пилотный код на основе этого блога с набором данных C#, который имеет около 40 тысяч строк файлов (всего около 7 миллиардов строк кода) с той же структурой, что и smangrul/hug_stack, и это репо для кода. Модель, которую я использую, — Codellama 7B, и параметры для поезда такие же, как и в run_peft.sh на машине с NixOS с двумя NVIDIA RTX A5000 24 ГБ, поэтому в необработанных данных все должно работать нормально, но когда придет время для оценки , это занимает буквально много времени и практически никогда не заканчивается. Когда я попытался запустить его всего на 100 строках, все сработало «отлично». Первая итерация заняла около 1 минуты, а оценка — около 20. Есть ли способ ускорить процесс оценки или есть что-то еще, что я мог бы сделать, чтобы иметь возможность обучать модель (другой подход, другое репо, лучшее ускорение на нескольких графических процессорах и т. д.)?

мой файл конфигурации:

WANDB_PROJECT=personal-copilot python train_acc.py \ --имя_модели_или_путь "codellama/CodeLlama-7b-hf" \ --dataset_name "rreit/c-sharp-dataset" \ --split "поезд" \ --max_seq_len 2048 \ --max_steps 2000 \ --save_steps 50 \ --eval_steps 100 \ --logging_steps 5 \ --log_level "информация" \ --logging_strategy "шаги" \ --evaluation_strategy "шаги" \ --save_strategy "шаги" \ --push_to_hub \ --hub_private_repo Правда \ --hub_strategy "каждое_сохранение" \ --bf16 Правда \ --learning_rate 5e-4 \ --lr_scheduler_type "косинус" \ --weight_decay 0.1 \ --warmup_ratio 0.1 \ --max_grad_norm 1.0 \ --output_dir "hug_stack-StaproCoder" \ --per_device_train_batch_size 8 \ --per_device_eval_batch_size 8 \ --gradient_accumulation_steps 4 \ --gradient_checkpointing Истина \ --use_reentrant Истина \ --dataset_text_field "текст" \ --test_size 0,1 \ --fim_rate 0,5 \ --fim_spm_rate 0,5 \ --use_peft_lora Правда \ --lora_r 32 \ --lora_alpha 64 \ --lora_dropout 0.1 \ --lora_target_modules "полностью линейный" \ --use_4bit_quantization True \ --use_nested_quant True \ --bnb_4bit_compute_dtype "bfloat16" \ --use_flash_attn Верно Наверное, это глупый вопрос, потому что обучение LLM должно занять много времени, но когда я попробовал его с полным набором данных, на выполнение 100 итераций ушло около 1 часа, затем более 2 часов на оценку, и вот тогда на сервере истек срок выполнения сценария.

1709221273

Anonymous


Я пытаюсь создать личный пилотный код на основе этого блога с набором данных C#, который имеет около 40 тысяч строк файлов (всего около 7 миллиардов строк кода) с той же структурой, что и smangrul/hug_stack, и это репо для кода. Модель, которую я использую, — Codellama 7B, и параметры для поезда такие же, как и в run_peft.sh на машине с NixOS с двумя NVIDIA RTX A5000 24 ГБ, поэтому в необработанных данных все должно работать нормально, но когда придет время для оценки , это занимает буквально много времени и практически никогда не заканчивается. Когда я попытался запустить его всего на 100 строках, все сработало «отлично». Первая итерация заняла около 1 минуты, а оценка — около 20. Есть ли способ ускорить процесс оценки или есть что-то еще, что я мог бы сделать, чтобы иметь возможность обучать модель (другой подход, другое репо, лучшее ускорение на нескольких графических процессорах и т. д.)?
 
мой файл конфигурации:
 
WANDB_PROJECT=personal-copilot python train_acc.py \ --имя_модели_или_путь "codellama/CodeLlama-7b-hf" \ --dataset_name "rreit/c-sharp-dataset" \ --split "поезд" \ --max_seq_len 2048 \ --max_steps 2000 \ --save_steps 50 \ --eval_steps 100 \ --logging_steps 5 \ --log_level "информация" \ --logging_strategy "шаги" \ --evaluation_strategy "шаги" \ --save_strategy "шаги" \ --push_to_hub \ --hub_private_repo Правда \ --hub_strategy "каждое_сохранение" \ --bf16 Правда \ --learning_rate 5e-4 \ --lr_scheduler_type "косинус" \ --weight_decay 0.1 \ --warmup_ratio 0.1 \ --max_grad_norm 1.0 \ --output_dir "hug_stack-StaproCoder" \ --per_device_train_batch_size 8 \ --per_device_eval_batch_size 8 \ --gradient_accumulation_steps 4 \ --gradient_checkpointing Истина \ --use_reentrant Истина \ --dataset_text_field "текст" \ --test_size 0,1 \ --fim_rate 0,5 \ --fim_spm_rate 0,5 \ --use_peft_lora Правда \ --lora_r 32 \ --lora_alpha 64 \ --lora_dropout 0.1 \ --lora_target_modules "полностью линейный" \ --use_4bit_quantization True \ --use_nested_quant True \ --bnb_4bit_compute_dtype "bfloat16" \ --use_flash_attn Верно  Наверное, это глупый вопрос, потому что обучение LLM должно занять много времени, но когда я попробовал его с полным набором данных, на выполнение 100 итераций ушло около 1 часа, затем более 2 часов на оценку, и вот тогда на сервере истек срок выполнения сценария.

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как отключить обратный вызов Нептуна при запуске тренера трансформеров?

Последнее сообщение Anonymous « 15 окт 2024, 16:57
Добавлено в форуме Python

Anonymous » 15 окт 2024, 16:57 » в форуме Python

После установки Neptune.ai для периодического протоколирования экспериментов ML он стал по умолчанию включаться в список обратных вызовов во всех запусках Transformers.trainer. В результате требуется правильная инициализация с использованием токена,...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 16:57
Как отключить обратный вызов Нептуна при запуске тренера трансформеров?

Последнее сообщение Anonymous « 19 окт 2024, 00:37
Добавлено в форуме Python

Anonymous » 19 окт 2024, 00:37 » в форуме Python

После установки Neptune.ai для периодического протоколирования экспериментов ML он стал по умолчанию включаться в список обратных вызовов во всех запусках Transformers.trainer. В результате требуется правильная инициализация с использованием токена,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
19 окт 2024, 00:37
Нативная сборка React «Оценка настроек» занимает вечность

Последнее сообщение Anonymous « 05 окт 2024, 14:04
Добавлено в форуме Android

Anonymous » 05 окт 2024, 14:04 » в форуме Android

Распечатка терминала
Я создаю мобильное приложение с помощью React Native и Typescript, до сих пор оно работало нормально, но вчера я попытался запустить его с помощью React Native Run- android, и он просто не проходит этот шаг «Оценка настроек»....

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
05 окт 2024, 14:04
Нативная сборка React «Оценка настроек» занимает вечность

Последнее сообщение Anonymous « 04 дек 2024, 01:38
Добавлено в форуме Android

Anonymous » 04 дек 2024, 01:38 » в форуме Android

Распечатка терминала
Я создаю мобильное приложение с помощью React Native и Typescript, до сих пор оно работало нормально, но вчера я попытался запустить его с помощью React Native Run- android, и он просто не проходит этот шаг «Оценка настроек»....

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
04 дек 2024, 01:38
Нативная сборка React «Оценка настроек» занимает вечность

Последнее сообщение Anonymous « 10 янв 2025, 10:36
Добавлено в форуме Android

Anonymous » 10 янв 2025, 10:36 » в форуме Android

Распечатка терминала
Я создаю мобильное приложение с помощью React Native и Typescript, до сих пор оно работало нормально, но вчера я попытался запустить его с помощью React Native Run- android, и он просто не проходит этот шаг «Оценка настроек»....

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
10 янв 2025, 10:36

Вернуться в «Python»