Я работаю над программой CUDA в WSL2 (Ubuntu 20.04) для тестирования ускорения графического процессора. Мое оборудование включает AMD R7 5800H и NVIDIA RTX 3070 Mobile. Я сравнил время выполнения моей программы на процессоре (последовательное выполнение) и графическом процессоре (параллельное выполнение). Удивительно, но выполнение графического процессора медленнее, чем выполнение процессора.
Попытка предварительного разогрева графического процессора путем многократного запуска ядра перед измерением времени выполнения. Однако результаты остаются прежними: выполнение графического процессора происходит медленнее, чем процессора.
Это мой код:
template
__global__ void parallel_for(int n, Func func) {
for(int i = blockDim.x * blockIdx.x + threadIdx.x;
i < n; i += blockDim.x + gridDim.x) {
func(i);
}
}
int main() {
int n = 1
Подробнее здесь: https://stackoverflow.com/questions/793 ... d-r7-5800h
Почему моя программа CUDA работает медленнее на графическом процессоре (RTX 3070 Mobile), чем на процессоре (AMD R7 5800 ⇐ C++
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как тренировать Paddleoc на графическом процессоре RTX 5070 TI? [закрыто]
Anonymous » » в форуме Python - 0 Ответы
- 5 Просмотры
-
Последнее сообщение Anonymous
-