Команды, которые я пробовал:
Код: Выделить всё
g++ -fopenmp-simd -O2 -S simd_reduction.cpp
g++ -fopenmp-simd -O2 -mavx2 -march=native -S simd_reduction.cpp
Код: Выделить всё
#include
float dot_product_simd(const float a[], const float b[], int n) {
float dot = 0.0;
#pragma omp parallel for simd reduction(+:dot)
for (int i = 0; i < n; i++) {
dot += a[i] * b[i];
}
return dot;
}
void multiply_arrays(const float a[], const float b[], float c[], int n) {
#pragma omp parallel for simd safelen(8)
for (int i = 0; i < n; i++) {
c[i] = a[i] * b[i];
}
}
При уменьшении скалярного произведения используются только регистры xmm, поэтому выполняются только 128-битные математические операции.
Исправлено ли это в более поздних версиях, нужно ли что-то еще сделать?
Подробнее здесь: https://stackoverflow.com/questions/791 ... this-earli