У меня есть моделирование Монте -Карло, в которой состояние системы составляет немного строки (размер n), а биты случайным образом перевернуты. Стремясь ускорить моделирование, код был пересмотрен для использования CUDA. Однако из -за большого количества статистики, которые мне необходимо, рассчитанное из состояния системы (идет как n^2), эта часть должна быть сделана на процессоре, где есть больше памяти. В настоящее время алгоритм выглядит следующим образом: < /p>
loop
CUDA kernel making 10s of Monte Carlo steps
Copy system state back to CPU
Calculate statistics
< /code>
Это неэффективно, и я хотел бы, чтобы ядро было постоянно, в то время как процессор иногда запрашивает состояние системы и вычисляет статистику, в то время как ядро продолжает работать. это.
Как настроить двойную буферизацию, описанную в третьем абзаце ответа Тома для кода CUDA/C ++?
Подробнее здесь: https://stackoverflow.com/questions/331 ... a-persiste
Удвоение буферизации в CUDA, чтобы процессор мог работать на данных, полученных постоянным ядром ⇐ C++
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение