Почему моя программа CUDA работает медленнее на графическом процессоре (RTX 3070 Mobile), чем на процессоре (AMD R7 5800C++

Программы на C++. Форум разработчиков
Ответить Пред. темаСлед. тема
Anonymous
 Почему моя программа CUDA работает медленнее на графическом процессоре (RTX 3070 Mobile), чем на процессоре (AMD R7 5800

Сообщение Anonymous »

Я работаю над программой CUDA в WSL2 (Ubuntu 20.04) для тестирования ускорения графического процессора. Мое оборудование включает AMD R7 5800H и NVIDIA RTX 3070 Mobile. Я сравнил время выполнения моей программы на процессоре (последовательное выполнение) и графическом процессоре (параллельное выполнение). Удивительно, но выполнение графического процессора медленнее, чем выполнение процессора.
Попытка предварительного разогрева графического процессора путем многократного запуска ядра перед измерением времени выполнения. Однако результаты остаются прежними: выполнение графического процессора происходит медленнее, чем процессора.
Это мой код:
template
__global__ void parallel_for(int n, Func func) {
for(int i = blockDim.x * blockIdx.x + threadIdx.x;
i < n; i += blockDim.x + gridDim.x) {
func(i);
}
}

int main() {
int n = 1

Подробнее здесь: https://stackoverflow.com/questions/793 ... d-r7-5800h
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «C++»