W1206 18:53:57.353000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18835 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18836 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py :897] Отправка сигнала закрытия процесса 18837. SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Процесс отправки 18839 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка сигнала закрытия процесса 18840 SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py :897] Отправка сигнала закрытия процесса 18841. SIGTERM
W1206 18:53:57.355000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18842 сигнала закрытия SIGTERM
E1206 18:53:57.387000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:869] не удалось (код выхода: 1) local_rank: 3 (pid: 18838) двоичного файла: /home/chacha/anaconda3/envs/drive/bin/pythonTraceback (последний вызов — последний):
Файл "/home/chacha/anaconda3/envs/drive/bin/accelerate", строка 8, в
sys.exit(main())
файле "/home/chacha/anaconda3/envs/drive/ lib/python3.10/site-packages/accelerate/commands/accelerate_cli.py", строка 48, в main
args.func(args)
Файл «/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/accelerate/commands/launch.py», строка 1159, в launch_commandmulti_gpu_launcher(args)
Файл "/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/accelerate/commands/launch.py", строка 793, в multi_gpu_launcher
distrib_run.run(args)
Файл "/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/torch/distributed/run.py", строка 910, в run
elastic_launch(
File "/home /chacha/anaconda3/envs/drive/lib/python3.10/site-packages/torch/distributed/launcher/api.py", строка 138, в вызове
return launch_agent(self._config, self._entrypoint, list(args))
Файл "/home/chacha/anaconda3/envs/drive/lib/ python3.10/site-packages/torch/distributed/launcher/api.py", строка 269, в launch_agent
raise ChildFailedError(
torch.distributed.elastic.multiprocessing.errors.ChildFailedError:
/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/ run_task.py ОШИБКА
Ошибки:
Основная причина (первый обнаруженный сбой):
[0]:
время: 2024-12-06_18:53:57
хост: DESKTOP-EJP3C2O.localdomain
ранг: 3 (local_rank: 3)
код выхода: 1 (pid: 18838)
файл_ошибки:
traceback: чтобы включить обратную трассировку, см.: https://pytorch.org/docs/stable/elastic/errors.html
Traceback (последний вызов — последний):
Файл "/home/drive/DriveDreamer-main/DriveDreamer-main/./dreamer-train/projects/launch.py", строка 35, в
main()
файле "/home/drive/DriveDreamer -main/DriveDreamer-main/./dreamer-train/projects/launch.py", строка 32, в main
launch_from_config(config_path, ','.join(opts.runners))
Файл "/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/launch.py", строка 175, в launch_from_config
launcher.launch('{} --config {} --runners {}'.format(file_path, config_path, runners))
Файл «/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/launch.py», строка 159, при запуске
os.remove(self.hostfile_path)
FileNotFoundError: [Errno 2] Нет такого файла или каталога: '_tmp/2024-12-06-185351_hostfile'
Код взят с github: https://github.com/JeffWang987/DriveDreamer
Когда код выполняется, этот код создаст файл конфигурации и файл хост-файла с метками времени, но хост-файл не может быть создан правильно.
Подробнее здесь: https://stackoverflow.com/questions/792 ... -correctly
Код не может правильно создать файл хост-файла. ⇐ Python
Программы на Python
-
Anonymous
1733483387
Anonymous
W1206 18:53:57.353000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18835 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18836 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py :897] Отправка сигнала закрытия процесса 18837. SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Процесс отправки 18839 сигнала закрытия SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка сигнала закрытия процесса 18840 SIGTERM
W1206 18:53:57.354000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py :897] Отправка сигнала закрытия процесса 18841. SIGTERM
W1206 18:53:57.355000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:897] Отправка процесса 18842 сигнала закрытия SIGTERM
E1206 18:53:57.387000 18802 site-packages/torch/distributed/elastic/multiprocessing/api.py:869] не удалось (код выхода: 1) local_rank: 3 (pid: 18838) двоичного файла: /home/chacha/anaconda3/envs/drive/bin/pythonTraceback (последний вызов — последний):
Файл "/home/chacha/anaconda3/envs/drive/bin/accelerate", строка 8, в
sys.exit(main())
файле "/home/chacha/anaconda3/envs/drive/ lib/python3.10/site-packages/accelerate/commands/accelerate_cli.py", строка 48, в main
args.func(args)
Файл «/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/accelerate/commands/launch.py», строка 1159, в launch_commandmulti_gpu_launcher(args)
Файл "/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/accelerate/commands/launch.py", строка 793, в multi_gpu_launcher
distrib_run.run(args)
Файл "/home/chacha/anaconda3/envs/drive/lib/python3.10/site-packages/torch/distributed/run.py", строка 910, в run
elastic_launch(
File "/home /chacha/anaconda3/envs/drive/lib/python3.10/site-packages/torch/distributed/launcher/api.py", строка 138, в [b]вызове[/b]
return launch_agent(self._config, self._entrypoint, list(args))
Файл "/home/chacha/anaconda3/envs/drive/lib/ python3.10/site-packages/torch/distributed/launcher/api.py", строка 269, в launch_agent
raise ChildFailedError(
torch.distributed.elastic.multiprocessing.errors.ChildFailedError:
/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/ run_task.py ОШИБКА
Ошибки:
Основная причина (первый обнаруженный сбой):
[0]:
время: 2024-12-06_18:53:57
хост: DESKTOP-EJP3C2O.localdomain
ранг: 3 (local_rank: 3)
код выхода: 1 (pid: 18838)
файл_ошибки:
traceback: чтобы включить обратную трассировку, см.: https://pytorch.org/docs/stable/elastic/errors.html
Traceback (последний вызов — последний):
Файл "/home/drive/DriveDreamer-main/DriveDreamer-main/./dreamer-train/projects/launch.py", строка 35, в
main()
файле "/home/drive/DriveDreamer -main/DriveDreamer-main/./dreamer-train/projects/launch.py", строка 32, в main
launch_from_config(config_path, ','.join(opts.runners))
Файл "/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/launch.py", строка 175, в launch_from_config
launcher.launch('{} --config {} --runners {}'.format(file_path, config_path, runners))
Файл «/home/drive/DriveDreamer-main/DriveDreamer-main/dreamer-train/dreamer_train/distributed/launch.py», строка 159, при запуске
os.remove(self.hostfile_path)
FileNotFoundError: [Errno 2] Нет такого файла или каталога: '_tmp/2024-12-06-185351_hostfile'
Код взят с github: https://github.com/JeffWang987/DriveDreamer
Когда код выполняется, этот код создаст файл конфигурации и файл хост-файла с метками времени, но хост-файл не может быть создан правильно.
Подробнее здесь: [url]https://stackoverflow.com/questions/79257775/the-code-cant-create-hostfile-file-correctly[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия