Ошибка MPI_Init_thread при интеграции LAMMPS и параллельного Python в скрипт Slurm

Ошибка MPI_Init_thread при интеграции LAMMPS и параллельного Python в скрипт Slurm ⇐ Linux

1 сообщение • Страница 1 из 1

Anonymous

Ошибка MPI_Init_thread при интеграции LAMMPS и параллельного Python в скрипт Slurm

Цитата

Сообщение Anonymous » 07 дек 2023, 16:58

Я пытаюсь отправить сценарий Slurm в кластеры моей школы, стремясь выполнить вычисления LAMMPS и постобработку с помощью параллельного Python на основе MPI в одном сценарии. Однако я столкнулся с ошибкой. Поэкспериментировав, я сократил сценарий до минимальной формы, которая постоянно вызывает ошибку. мой файл Slurm выглядит так:

#!/bin/bash #SBATCH --job-name=xx #SBATCH -N 1 #SBATCH -n 48 #SBATCH -o %J.out #SBATCH -e %J.err #SBATCH --partition=xxx источник /data/soft/profile.d/lammps.sh источник активировать среду mpirun -np $SLURM_NPROCS заказ/order.py Файл «lammps.sh» импортирует необходимые переменные среды для вычислений LAMMPS, и его содержимое по существу следующее:

LAMMPS_HOME_DIR=/data/soft/lammps/29Oct20 экспортировать PATH=${LAMMPS_HOME_DIR}/bin:$PATH экспорт LIBRARY_PATH=${LAMMPS_HOME_DIR}/lib:${LAMMPS_HOME_DIR}/external_libs/lib:${LAMMPS_HOME_DIR}/external_libs/lib64:$LIBRARY_PATH Env — это виртуальная среда с установленным mpi4py. «order.py» — это файл, использующий mpi4py. Когда я отправляю файл, я получаю следующую ошибку:

*** Произошла ошибка в MPI_Init_thread. *** на НУЛЕВОМ коммуникаторе *** MPI_ERRORS_ARE_FATAL (процессы в этом коммуникаторе теперь будут прерываться, *** и, возможно, ваша работа в MPI) [node2:250691] Локальное прерывание до завершения MPI_INIT завершилось успешно, но я не могу агрегировать сообщения об ошибках и не могу гарантировать, что все остальные процессы были завершены! Эта ошибка повторяется 48 раз. Однако когда я закомментирую первую строку (т. е. источник /data/soft/profile.d/lammps.sh), оставшаяся параллельная часть Python запускается успешно.

Я уверен в правильности моего распараллеливания. Поэтому мне хотелось бы понять причину ошибки и существуют ли подходы к сосуществованию обоих разделов (LAMMPS и Python) или альтернативные способы достижения того же эффекта.

1701957523

Anonymous


Я пытаюсь отправить сценарий Slurm в кластеры моей школы, стремясь выполнить вычисления LAMMPS и постобработку с помощью параллельного Python на основе MPI в одном сценарии. Однако я столкнулся с ошибкой. Поэкспериментировав, я сократил сценарий до минимальной формы, которая постоянно вызывает ошибку. мой файл Slurm выглядит так:
 
#!/bin/bash #SBATCH --job-name=xx #SBATCH -N 1 #SBATCH -n 48 #SBATCH -o %J.out #SBATCH -e %J.err #SBATCH --partition=xxx источник /data/soft/profile.d/lammps.sh источник активировать среду mpirun -np $SLURM_NPROCS заказ/order.py  Файл «lammps.sh» импортирует необходимые переменные среды для вычислений LAMMPS, и его содержимое по существу следующее:
 
LAMMPS_HOME_DIR=/data/soft/lammps/29Oct20 экспортировать PATH=${LAMMPS_HOME_DIR}/bin:$PATH экспорт LIBRARY_PATH=${LAMMPS_HOME_DIR}/lib:${LAMMPS_HOME_DIR}/external_libs/lib:${LAMMPS_HOME_DIR}/external_libs/lib64:$LIBRARY_PATH  Env — это виртуальная среда с установленным mpi4py. «order.py» — это файл, использующий mpi4py. Когда я отправляю файл, я получаю следующую ошибку:
 
*** Произошла ошибка в MPI_Init_thread. *** на НУЛЕВОМ коммуникаторе *** MPI_ERRORS_ARE_FATAL (процессы в этом коммуникаторе теперь будут прерываться, *** и, возможно, ваша работа в MPI) [node2:250691] Локальное прерывание до завершения MPI_INIT завершилось успешно, но я не могу агрегировать сообщения об ошибках и не могу гарантировать, что все остальные процессы были завершены!  Эта ошибка повторяется 48 раз. Однако когда я закомментирую первую строку (т. е. источник /data/soft/profile.d/lammps.sh), оставшаяся параллельная часть Python запускается успешно.
 
Я уверен в правильности моего распараллеливания. Поэтому мне хотелось бы понять причину ошибки и существуют ли подходы к сосуществованию обоих разделов (LAMMPS и Python) или альтернативные способы достижения того же эффекта.

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Проблема со связью MPI в Python (с использованием MPI.COMM_WORLD.isend и MPI.COMM_WORLD.irecv) — нет получения

Последнее сообщение Anonymous « 17 дек 2024, 22:01
Добавлено в форуме Python

Anonymous » 17 дек 2024, 22:01 » в форуме Python

Я работаю над параллельной программой, использующей mpi4py в Python, и столкнулся с проблемой, когда данные отправляются с помощью MPI.COMM_WORLD.isend, но когда принимающий процесс пытается получить данные с помощью MPI.COMM_WORLD.irecv, он...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
17 дек 2024, 22:01
Как запустить сценарий MPI Python на нескольких узлах в кластере Slurm? Ошибка: Предупреждение: невозможно запустить 1 п

Последнее сообщение Anonymous « 07 ноя 2024, 00:37
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 00:37 » в форуме Python

Я запускаю сценарий в кластере Slurm, который может выиграть от параллельной обработки, поэтому я пытаюсь реализовать MPI. Однако, похоже, это не позволяет мне запускать процессы на нескольких узлах. Я не знаю, делается ли это обычно автоматически,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 00:37
Как я могу получить доступ к исходным границам коробки XLO/XHI из файла дампа Lammps, используя MDAnalysis в Python?

Последнее сообщение Anonymous « 14 апр 2025, 12:54
Добавлено в форуме Python

Anonymous » 14 апр 2025, 12:54 » в форуме Python

Я работаю с траекторией Lammps в Mdanalysis с использованием формата LammpsDump по умолчанию, например:
import MDAnalysis as mda
u = mda.Universe( datfile.data , dump.LAMMPSDUMP )

В моем файле дампа Lammps границы полевой записи записываются...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
14 апр 2025, 12:54
Mpi4py односторонний тестовый скрипт MPI

Последнее сообщение Anonymous « 07 ноя 2024, 15:56
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 15:56 » в форуме Python

Я пытаюсь установить mpi-sppy, но мне приходится выполнять базовый тестовый сценарий, чтобы убедиться, что односторонние вызовы MPI работают. Я использую MPICH в Ubuntu 22.04 в Windows 11 от WSL2. Версии: mpi4py==4.0.1 и MPICH Version:4.0.
В строке...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 15:56
Mpi4py односторонний тестовый скрипт MPI

Последнее сообщение Anonymous « 07 ноя 2024, 17:17
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 17:17 » в форуме Python

Я пытаюсь установить mpi-sppy, но мне приходится выполнять базовый тестовый сценарий, чтобы убедиться, что односторонние вызовы MPI работают. Я использую MPICH в Ubuntu 22.04 в Windows 11 от WSL2. Версии: mpi4py==4.0.1 и MPICH Version:4.0.
В строке...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 17:17

Вернуться в «Linux»