Код: Выделить всё
__global__ void sumColumns(float* d_a, float* d_sum, int n) {
if (blockIdx.x < 2 && threadIdx.x < n) {
d_sum[blockIdx.x] += d_a[threadIdx.x * 2 + blockIdx.x];
}
}
Код: Выделить всё
sumColumns (d_a, d_sum, 1024);
< /code>
пройдет все строки, столбцы (асинхронно), а затем сгенерировать сумму каждого столбца (dsumМодель, которую я имею в своем уме, заключается в том, что после вызова ядра графический балл генерирует 1024 потоков в каждом блоке, а затем дается текущая нить, что заявление IF делает правильное макировка. Может ли кто -нибудь дать правильное описание того, что происходит?
Подробнее здесь: https://stackoverflow.com/questions/796 ... ad-mapping
Мобильная версия