Я пытался обучить модель resnet50, предоставленную PyTorch, на TPU v5-e8 с использованием пакета torch_xla, поскольку мой запас графического процессора Kaggle почти исчерпан. Однако я постоянно сталкивался с проблемами. Обучение на одном ядре TPU работает, но как только я пытаюсь использовать многоядерную обработку, начинается ад. Для справки я использовал фрагменты кода, представленные на странице XLA на GitHub, а также официальную документацию PyTorch XLA, но все равно каждый раз получаю одну и ту же ошибку. ИИ тоже не поможет. Использование аргумента отладки debug_single_process=True в torch_xla.launch() для указания использования только одного ядра — единственный способ заставить его работать, но это противоречит цели.
Bad StatusOr access: UNKNOWN: TPU initialization failed: Invalid --2a886c8_slice_builder_worker_addresses specified. Expected 8 worker addresses, got 1.
Подробнее здесь: https://stackoverflow.com/questions/799 ... ng-on-kagg
Как обучить нейронные сети PyTorch на TPU с многоядерной обработкой на Kaggle? ⇐ Python
Программы на Python
1772767717
Anonymous
Я пытался обучить модель resnet50, предоставленную PyTorch, на TPU v5-e8 с использованием пакета torch_xla, поскольку мой запас графического процессора Kaggle почти исчерпан. Однако я постоянно сталкивался с проблемами. Обучение на одном ядре TPU работает, но как только я пытаюсь использовать многоядерную обработку, начинается ад. Для справки я использовал фрагменты кода, представленные на странице XLA на GitHub, а также официальную документацию PyTorch XLA, но все равно каждый раз получаю одну и ту же ошибку. ИИ тоже не поможет. Использование аргумента отладки debug_single_process=True в torch_xla.launch() для указания использования только одного ядра — единственный способ заставить его работать, но это противоречит цели.
Bad StatusOr access: UNKNOWN: TPU initialization failed: Invalid --2a886c8_slice_builder_worker_addresses specified. Expected 8 worker addresses, got 1.
Подробнее здесь: [url]https://stackoverflow.com/questions/79901976/how-to-train-pytorch-neural-networks-on-a-tpu-with-multi-core-processing-on-kagg[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия