Программы на Python
Anonymous
Исключение: невозможно загрузить параметры модели из контрольной точки /home/krish/content/1.2B_last_checkpoint.pt; пожа
Сообщение
Anonymous » 08 июл 2024, 04:02
Я настраиваю модель M2M, используя модель 1.2B в качестве последней контрольной точки. Но при обучении модели я получаю сообщение об ошибке: она не может загрузить параметры, и архитектура модели должна совпадать.
попробуйте:
Код: Выделить всё
train_command = 'CUDA_VISIBLE_DEVICES="0" python /home/krish/content/train.py /home/krish/content/Hindi_Marathi/wmt22_spm/wmt22_bin \
--arch transformer_wmt_en_de_big \
--task translation_multi_simple_epoch \
--finetune-from-model /home/krish/content/1.2B_last_checkpoint.pt \
--save-dir /home/krish/content/Hindi_Marathi/checkpoint \
--langs \'hi,mr\' \
--lang-pairs \'hi-mr\' \
--max-tokens 1200 \
--encoder-normalize-before --decoder-normalize-before \
--sampling-method temperature --sampling-temperature 1.5 \
--encoder-langtok src --decoder-langtok \
--criterion label_smoothed_cross_entropy --label-smoothing 0.2 \
--optimizer adam --adam-eps 1e-06 --adam-betas \'(0.9, 0.98)\' \
--lr-scheduler inverse_sqrt --lr 3e-05 \
--warmup-updates 2500 --max-update 40000 \
--dropout 0.3 --attention-dropout 0.1 \
--weight-decay 0.0 \
--update-freq 2 --save-interval 5 \
--save-interval-updates 5000 --keep-interval-updates 3 \
--no-epoch-checkpoints \
--seed 222 \
--log-format simple \
--log-interval 2 \
--encoder-layers 12 --decoder-layers 12 \
--encoder-layerdrop 0.05 --decoder-layerdrop 0.05 \
--share-decoder-input-output-embed \
--share-all-embeddings \
--ddp-backend no_c10d'
Это был сценарий обучения. Здесь я проверил на модели, что арка только «transformer_wmt_en_de_big». Как мне решить эту проблему?
Подробнее здесь:
https://stackoverflow.com/questions/787 ... ntent-1-2b
1720400559
Anonymous
Я настраиваю модель M2M, используя модель 1.2B в качестве последней контрольной точки. Но при обучении модели я получаю сообщение об ошибке: она не может загрузить параметры, и архитектура модели должна совпадать. попробуйте: [code]train_command = 'CUDA_VISIBLE_DEVICES="0" python /home/krish/content/train.py /home/krish/content/Hindi_Marathi/wmt22_spm/wmt22_bin \ --arch transformer_wmt_en_de_big \ --task translation_multi_simple_epoch \ --finetune-from-model /home/krish/content/1.2B_last_checkpoint.pt \ --save-dir /home/krish/content/Hindi_Marathi/checkpoint \ --langs \'hi,mr\' \ --lang-pairs \'hi-mr\' \ --max-tokens 1200 \ --encoder-normalize-before --decoder-normalize-before \ --sampling-method temperature --sampling-temperature 1.5 \ --encoder-langtok src --decoder-langtok \ --criterion label_smoothed_cross_entropy --label-smoothing 0.2 \ --optimizer adam --adam-eps 1e-06 --adam-betas \'(0.9, 0.98)\' \ --lr-scheduler inverse_sqrt --lr 3e-05 \ --warmup-updates 2500 --max-update 40000 \ --dropout 0.3 --attention-dropout 0.1 \ --weight-decay 0.0 \ --update-freq 2 --save-interval 5 \ --save-interval-updates 5000 --keep-interval-updates 3 \ --no-epoch-checkpoints \ --seed 222 \ --log-format simple \ --log-interval 2 \ --encoder-layers 12 --decoder-layers 12 \ --encoder-layerdrop 0.05 --decoder-layerdrop 0.05 \ --share-decoder-input-output-embed \ --share-all-embeddings \ --ddp-backend no_c10d' [/code] Это был сценарий обучения. Здесь я проверил на модели, что арка только «transformer_wmt_en_de_big». Как мне решить эту проблему? Подробнее здесь: [url]https://stackoverflow.com/questions/78717366/exception-cannot-load-model-parameters-from-checkpoint-home-krish-content-1-2b[/url]
Применение `vmap` к модели с` torch.utils.checkpoint.checkpoint`
Anonymous »
25 фев 2025, 14:15 » в форуме
Python
Мне нужно использовать vmap для вычисления градиента по отношению к модели, в которой используется torch.utils.checkpoint.checkpoint .
Я получил следующую ошибку
runtimeerror: вы пытались пройти VMAP через _noopsaveinputs, но это не
не имеет...
0 Ответы
12 Просмотры
Последнее сообщение Anonymous
25 фев 2025, 14:15
Селектор :last vs :last-child
Anonymous »
03 авг 2024, 00:14 » в форуме
Jquery
Я заметил, что $( 'filter:last' ) отличается от $( 'filter:last-child' ) в jQuery.
Я попробовал документацию jQuery, но мне было трудно понять, какую дополнительную цель выполняет :last и почему они оба существуют.
Очевидно, :last — это...
0 Ответы
27 Просмотры
Последнее сообщение Anonymous
03 авг 2024, 00:14
0 Ответы
66 Просмотры
Последнее сообщение Anonymous
05 фев 2025, 06:12
0 Ответы
50 Просмотры
Последнее сообщение Anonymous
18 окт 2023, 16:39
API Home Document с использованием json-home
Anonymous »
29 июл 2025, 14:11 » в форуме
Php
Я разрабатываю небольшой веб -API в PHP и стараюсь сделать его максимально спокойным. Я обнаружил формат JSON-Home (см. Draft-Nottingham-Json-Home-02), что кажется довольно полезным в моем случае. Но так как это не так много, трудно найти примеры....
0 Ответы
12 Просмотры
Последнее сообщение Anonymous
29 июл 2025, 14:11