Я работаю над программой CUDA в WSL2 (Ubuntu 20.04) для тестирования ускорения графического процессора. Мое оборудование включает AMD R7 5800H и NVIDIA RTX 3070 Mobile. Я сравнил время выполнения моей программы на процессоре (последовательное выполнение) и графическом процессоре (параллельное выполнение). Удивительно, но выполнение графического процессора медленнее, чем выполнение процессора.
Попытка предварительного разогрева графического процессора путем многократного запуска ядра перед измерением времени выполнения. Однако результаты остаются прежними: выполнение графического процессора происходит медленнее, чем процессора.
Это мой код:
template
__global__ void parallel_for(int n, Func func) {
for(int i = blockDim.x * blockIdx.x + threadIdx.x;
i < n; i += blockDim.x + gridDim.x) {
func(i);
}
}
int main() {
int n = 1
Подробнее здесь: https://stackoverflow.com/questions/793 ... d-r7-5800h
Мобильная версия