Код не может правильно создать файл хост-файла.Python

Программы на Python
Ответить
Anonymous
 Код не может правильно создать файл хост-файла.

Сообщение Anonymous »

W1206 18:53:57.353000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18835 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18836 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py :897] Отправка сигнала закрытия процесса 18837. SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Процесс отправки 18839 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка сигнала закрытия процесса 18840 SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py :897] Отправка сигнала закрытия процесса 18841. SIGTERM
W1206 18:53:57.355000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18842 сигнала закрытия SIGTERM
E1206 18:53:57.387000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:869] не удалось (код выхода: 1) local_rank: 3 (pid: 18838) двоичного файла: /home/chacha/anaconda3/envs/drive/bin/pythonTraceback (последний вызов — последний):
Файл "/home/chacha/anaconda3/envs/drive/bin/accelerate", строка 8, в
sys.exit(main())
файле "/home/chacha/anaconda3/envs/drive/ lib/python3.10/site-packages/accelerate/commands/accelerate_cli.py", строка 48, в main
args.func(args)
Файл «/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/accelerate/commands/launch.py», строка 1159, в launch_commandmulti_gpu_launcher(args)
Файл "/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/accelerate/commands/launch.py", строка 793, в multi_gpu_launcher
distrib_run.run(args)
Файл "/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/torch/distributed/run.py", строка 910, в run
elastic_launch(
File "/home /chacha/anaconda3/envs/drive/lib/python3.10/site-packages/torch/distributed/launcher/api.py", строка 138, в вызове
return launch_agent(self._config, self._entrypoint, list(args))
Файл "/home/chacha/anaconda3/envs/drive/lib/ python3.10/site-packages/torch/distributed/launcher/api.py", строка 269, в launch_agent
raise ChildFailedError(
torch.distributed.elastic.multiprocessing.errors.ChildFailedError:
/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/ run_task.py ОШИБКА
Ошибки:

Основная причина (первый обнаруженный сбой):
[0]:
время: 2024-12-06_18:53:57
хост: DESKTOP-EJP3C2O.localdomain
ранг: 3 (local_rank: 3)
код выхода: 1 (pid: 18838)
файл_ошибки:
traceback: чтобы включить обратную трассировку, см.: https://pytorch.org/docs/stable/elastic/errors.html
Traceback (последний вызов — последний):
Файл "/home/drive/DriveDreamer-main/DriveDreamer-main/./dreamer-train/projects/launch.py", строка 35, в
main()
файле "/home/drive/DriveDreamer -main/DriveDreamer-main/./dreamer-train/projects/launch.py", строка 32, в main
launch_from_config(config_path, ','.join(opts.runners))
Файл "/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/launch.py", строка 175, в launch_from_config
launcher.launch('{} --config {} --runners {}'.format(file_path, config_path, runners))
Файл «/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/launch.py», строка 159, при запуске
os.remove(self.hostfile_path)
FileNotFoundError: [Errno 2] Нет такого файла или каталога: '_tmp/2024-12-06-185351_hostfile'
Код взят с github: https://github.com/JeffWang987/DriveDreamer
Когда код выполняется, этот код создаст файл конфигурации и файл хост-файла с метками времени, но хост-файл не может быть создан правильно.

Подробнее здесь: https://stackoverflow.com/questions/792 ... -correctly
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»