основной файл конфигурации выглядит следующим образом:
Код: Выделить всё
defaults:
- override hydra/launcher: slurm
foo: 1
Код: Выделить всё
defaults:
- submitit_slurm
_target_: hydra_plugins.hydra_submitit_launcher.submitit_launcher.SlurmLauncher
submitit_folder: ${hydra.sweep.dir}/.submitit/%j
name: ${hydra.job.name}
Код: Выделить всё
|--project
| |--src
| | |--main.py
| | |--models
| | | |--__init__.py
| | | |--file1.py
| | | |--file2.py
| |--scripts
| | |--run.sh
ПРОБЛЕМА:
когда я закомментирую панель запуска submitit в основном файле конфигурации, все работает гладко < strong>НО когда я раскомментирую его, я получаю это сообщение об ошибке
Код: Выделить всё
submitit ERROR (2025-01-04 21:31:32,789) - Submitted job triggered an exception
Traceback (most recent call last):
File "", line 198, in _run_module_as_main
File "", line 88, in _run_code
File "/home/a/.conda/envs/hinet/lib/python3.12/site-packages/submitit/core/_submit.py", line 11, in
submitit_main()
File "/home/a/.conda/envs/hinet/lib/python3.12/site-packages/submitit/core/submission.py", line 76, in submitit_main
process_job(args.folder)
File "/home/a/.conda/envs/hinet/lib/python3.12/site-packages/submitit/core/submission.py", line 69, in process_job
raise error
File "/home/a/.conda/envs/hinet/lib/python3.12/site-packages/submitit/core/submission.py", line 52, in process_job
delayed = utils.DelayedSubmission.load(paths.submitted_pickle)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/home/a/.conda/envs/hinet/lib/python3.12/site-packages/submitit/core/utils.py", line 153, in load
obj = pickle_load(filepath)
^^^^^^^^^^^^^^^^^^^^^
File "/home/a/.conda/envs/hinet/lib/python3.12/site-packages/submitit/core/utils.py", line 232, in pickle_load
return pickle.load(ifile)
^^^^^^^^^^^^^^^^^^
ModuleNotFoundError: No module named 'models'
Спасибо!
Подробнее здесь: https://stackoverflow.com/questions/793 ... orted-norm