Я закодировал следующий кусок кода в качестве учебного упражнения, он имеет проблему синхронизации в функции, вызывающем ядро Cuda, которое уходит, если я добавлю точку разрыва в строку кода, показанную ниже в функции, которая вызывает ядро. Как это исправить? < /P>
Следующее мое ядро.__global__ void sum_gpu_kernel(float* Numbers, uint32_t Size)
{
__shared__ float numbers[2u * _threads_per_block];
for (uint32_t i = 0u; i < 2u; i++)
{
if (threadIdx.x + blockIdx.x * blockDim.x + i * gridDim.x * blockDim.x < Size)
{
numbers[threadIdx.x + i * _threads_per_block] = Numbers[threadIdx.x + blockIdx.x * blockDim.x + i * gridDim.x * blockDim.x];
}
}
__syncthreads();
for (uint32_t i = _threads_per_block; i > 0u; i /= 2u)
{
numbers[threadIdx.x] += numbers[threadIdx.x + i];
__syncthreads();
}
if (threadIdx.x == 0u)
{
Numbers[blockIdx.x] = numbers[0u];
}
__syncthreads();
}
< /code>
, а следующая функция процессора вызывает ядро. < /p>
bool sum_gpu(float* Sum, float* Numbers, uint32_t Size)
{
bool ret_val = true;
float* numbers = nullptr;
dim3 threads = { _threads_per_block, 1, 1 };
dim3 blocks = { (Size + 2u * _threads_per_block - 1) / (2u * _threads_per_block), 1, 1 };
if (cudaMalloc(&numbers, Size * sizeof(float)) != cudaSuccess)
{
ret_val = false;
goto terminate;
}
if (cudaMemcpy(numbers, Numbers, Size * sizeof(float), cudaMemcpyHostToDevice) != cudaSuccess)
{
ret_val = false;
goto terminate;
}
while (1)
{
sum_gpu_kernel>(numbers, Size);
if (cudaGetLastError() != cudaSuccess)
{
ret_val = false;
goto terminate;
}
if (cudaDeviceSynchronize() != cudaSuccess)
{
ret_val = false;
goto terminate;
}
if (blocks.x == 1u)
{
break;
}
Size = blocks.x; //
Подробнее здесь: https://stackoverflow.com/questions/797 ... ion-issues
Проблемы синхронизации CUDA ⇐ C++
Программы на C++. Форум разработчиков
1757433679
Anonymous
Я закодировал следующий кусок кода в качестве учебного упражнения, он имеет проблему синхронизации в функции, вызывающем ядро Cuda, которое уходит, если я добавлю точку разрыва в строку кода, показанную ниже в функции, которая вызывает ядро. Как это исправить? < /P>
Следующее мое ядро.__global__ void sum_gpu_kernel(float* Numbers, uint32_t Size)
{
__shared__ float numbers[2u * _threads_per_block];
for (uint32_t i = 0u; i < 2u; i++)
{
if (threadIdx.x + blockIdx.x * blockDim.x + i * gridDim.x * blockDim.x < Size)
{
numbers[threadIdx.x + i * _threads_per_block] = Numbers[threadIdx.x + blockIdx.x * blockDim.x + i * gridDim.x * blockDim.x];
}
}
__syncthreads();
for (uint32_t i = _threads_per_block; i > 0u; i /= 2u)
{
numbers[threadIdx.x] += numbers[threadIdx.x + i];
__syncthreads();
}
if (threadIdx.x == 0u)
{
Numbers[blockIdx.x] = numbers[0u];
}
__syncthreads();
}
< /code>
, а следующая функция процессора вызывает ядро. < /p>
bool sum_gpu(float* Sum, float* Numbers, uint32_t Size)
{
bool ret_val = true;
float* numbers = nullptr;
dim3 threads = { _threads_per_block, 1, 1 };
dim3 blocks = { (Size + 2u * _threads_per_block - 1) / (2u * _threads_per_block), 1, 1 };
if (cudaMalloc(&numbers, Size * sizeof(float)) != cudaSuccess)
{
ret_val = false;
goto terminate;
}
if (cudaMemcpy(numbers, Numbers, Size * sizeof(float), cudaMemcpyHostToDevice) != cudaSuccess)
{
ret_val = false;
goto terminate;
}
while (1)
{
sum_gpu_kernel>(numbers, Size);
if (cudaGetLastError() != cudaSuccess)
{
ret_val = false;
goto terminate;
}
if (cudaDeviceSynchronize() != cudaSuccess)
{
ret_val = false;
goto terminate;
}
if (blocks.x == 1u)
{
break;
}
Size = blocks.x; //
Подробнее здесь: [url]https://stackoverflow.com/questions/79760075/cuda-synchronization-issues[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия