Проблемы синхронизации CUDAC++

Программы на C++. Форум разработчиков
Ответить
Anonymous
 Проблемы синхронизации CUDA

Сообщение Anonymous »

Я закодировал следующий кусок кода в качестве учебного упражнения, он имеет проблему синхронизации в функции, вызывающей ядро ​​Cuda, которое уходит, если я добавлю точку разрыва в строку кода, показанную ниже в функции, которая вызывает ядро. Как это исправить? < /P>
Следующее мое ядро.__global__ void sum_gpu_kernel(float* Numbers, uint32_t Size)
{
__shared__ float numbers[2u * _threads_per_block];

for (uint32_t i = 0u; i < 2u; i++)
{
if (threadIdx.x + blockIdx.x * blockDim.x + i * gridDim.x * blockDim.x < Size)
{
numbers[threadIdx.x + i * _threads_per_block] = Numbers[threadIdx.x + blockIdx.x * blockDim.x + i * gridDim.x * blockDim.x];
}
}

__syncthreads();

for (uint32_t i = _threads_per_block; i > 0u; i /= 2u)
{
numbers[threadIdx.x] += numbers[threadIdx.x + i];

__syncthreads();
}

if (threadIdx.x == 0u)
{
Numbers[blockIdx.x] = numbers[0u];
}

__syncthreads();
}
< /code>
, а следующая функция процессора вызывает ядро. < /p>
bool sum_gpu(float* Sum, float* Numbers, uint32_t Size)
{
bool ret_val = true;
float* numbers = nullptr;
dim3 threads = { _threads_per_block, 1, 1 };
dim3 blocks = { (Size + 2u * _threads_per_block - 1) / (2u * _threads_per_block), 1, 1 };

if (cudaMalloc(&numbers, Size * sizeof(float)) != cudaSuccess)
{
ret_val = false;
goto terminate;
}

if (cudaMemcpy(numbers, Numbers, Size * sizeof(float), cudaMemcpyHostToDevice) != cudaSuccess)
{
ret_val = false;
goto terminate;
}

while (1)
{
sum_gpu_kernel>(numbers, Size);

if (cudaGetLastError() != cudaSuccess)
{
ret_val = false;
goto terminate;
}

if (cudaDeviceSynchronize() != cudaSuccess)
{
ret_val = false;
goto terminate;
}

if (blocks.x == 1u)
{
break;
}

Size = blocks.x; //

Подробнее здесь: https://stackoverflow.com/questions/797 ... ion-issues
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «C++»