Удвоение буферизации в CUDA, чтобы процессор мог работать на данных, полученных постоянным ядром

Удвоение буферизации в CUDA, чтобы процессор мог работать на данных, полученных постоянным ядром ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Удвоение буферизации в CUDA, чтобы процессор мог работать на данных, полученных постоянным ядром

Сообщение Anonymous » 25 июн 2025, 03:59

У меня есть моделирование Монте -Карло, в которой состояние системы составляет немного строки (размер n), а биты случайным образом перевернуты. Стремясь ускорить моделирование, код был пересмотрен для использования CUDA. Однако из -за большого количества статистики, которые мне необходимо, рассчитанное из состояния системы (идет как n^2), эта часть должна быть сделана на процессоре, где есть больше памяти. В настоящее время алгоритм выглядит следующим образом: < /p>

loop
CUDA kernel making 10s of Monte Carlo steps
Copy system state back to CPU
Calculate statistics
< /code>

Это неэффективно, и я хотел бы, чтобы ядро было постоянно, в то время как процессор иногда запрашивает состояние системы и вычисляет статистику, в то время как ядро продолжает работать. это.

Как настроить двойную буферизацию, описанную в третьем абзаце ответа Тома для кода CUDA/C ++?

Подробнее здесь: https://stackoverflow.com/questions/331 ... a-persiste

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «C++»