В векторном сложении, почему эффективность не улучшилась, несмотря на увеличение количества потоков CUDA?C++

Программы на C++. Форум разработчиков
Ответить
Anonymous
 В векторном сложении, почему эффективность не улучшилась, несмотря на увеличение количества потоков CUDA?

Сообщение Anonymous »

Я пытался использовать CUDA для ускорения сложения векторов.
Из add 3,0164 мс (используйте nvprof)
Изображение
Изображение

Код: Выделить всё

#include 
#include 
// Kernel function to add the elements of two arrays
__global__
void add(int n, float *x, float *y)
{
int index = threadIdx.x;
int stride = blockDim.x;
for (int i = index; i < n; i += stride)
y[i] = x[i] + y[i];
}

int main(void)
{
int N = 1

Подробнее здесь: [url]https://stackoverflow.com/questions/79317982/in-vector-addition-why-did-the-efficiency-not-improve-despite-increasing-the-nu[/url]
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «C++»