Как проверить, какие ядра вычислительных возможностей CUDA доступны? ⇐ C++
-
Гость
Как проверить, какие ядра вычислительных возможностей CUDA доступны?
Есть ли способ проверить во время выполнения, для каких вычислительных возможностей CUDA была скомпилирована текущая программа? Или флаги arch=compute_xx,code=sm_xx устанавливают какие-либо определения, которые можно проверить?
Я не могу убедиться, что пользователи имеют «правильную» настройку для развернутого двоичного файла. Для этого я хотел бы сравнить CC их устройства (с помощью cudaGetDeviceProperties) с скомпилированным CC перед началом длительной инициализации. До сих пор я мог попытаться запустить ядро и использовать cudaPeekAtLastError для выхода только тогда, когда нет образа ядра, доступного для выполнения на устройстве.
РЕДАКТИРОВАТЬ: я пробовал использовать cudaFuncGetAttributes вот так (main.cu):
#include __global__ void cudaKernel() { ; } интервал основной() { cudaFuncAttributes attr; cudaError_t err = cudaFuncGetAttributes(&attr, cudaKernel); если (ошибка != cudaSuccess) { std::cout
Есть ли способ проверить во время выполнения, для каких вычислительных возможностей CUDA была скомпилирована текущая программа? Или флаги arch=compute_xx,code=sm_xx устанавливают какие-либо определения, которые можно проверить?
Я не могу убедиться, что пользователи имеют «правильную» настройку для развернутого двоичного файла. Для этого я хотел бы сравнить CC их устройства (с помощью cudaGetDeviceProperties) с скомпилированным CC перед началом длительной инициализации. До сих пор я мог попытаться запустить ядро и использовать cudaPeekAtLastError для выхода только тогда, когда нет образа ядра, доступного для выполнения на устройстве.
РЕДАКТИРОВАТЬ: я пробовал использовать cudaFuncGetAttributes вот так (main.cu):
#include __global__ void cudaKernel() { ; } интервал основной() { cudaFuncAttributes attr; cudaError_t err = cudaFuncGetAttributes(&attr, cudaKernel); если (ошибка != cudaSuccess) { std::cout
Мобильная версия