Как я могу получить подробные метрики GPU (например, использование и использование памяти) при профилировании кода CUDA? /> [*] Использование памяти (Global/Shared/Constant Memory Breakdown).
[*] Время выполнения ядра (с большей детализацией, чем просто «продолжительность запуска»).
я попробовал nvprp. Ограничения: < /strong> < /p>
Basic nvprof: < /li>
< /ul>
nvprof ./my_cuda_app
< /code>
Показывает время выполнения ядра, но нет % использования % или статистики памяти.nvprof --pring-gpu-trace ./my_cuda_app
< /code>
Показывает все вызовы, это время выполнения, другие вещи, но все же ничего похожего на использование GPU < /p>
Мои вопросы: < /strong> < /p>
Как я могу включить отслеживание использования GP>
См. Использование памяти на ядро? /> < /li>
cuda 12.8 < /p>
< /li>
< /ul>
Любые советы по инструментам или командам о том, как получить эти метрики, будут очень оценены < /p>
Подробнее здесь: https://stackoverflow.com/questions/795 ... a-applicat
Как правильно профилировать метрики графических процессоров (использование, использование памяти) в приложениях CUDA? [з ⇐ C++
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение