Gcc 11.4 openmp, похоже, не генерирует инструкции AVX2. Судя по этому более раннему stackoverflow, что я делаю не так? - Цифровое Кемерово

Gcc 11.4 openmp, похоже, не генерирует инструкции AVX2. Судя по этому более раннему stackoverflow, что я делаю не так? ⇐ C++

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Gcc 11.4 openmp, похоже, не генерирует инструкции AVX2. Судя по этому более раннему stackoverflow, что я делаю не так?

Цитата

Сообщение Anonymous » 27 окт 2024, 22:05

Я использую popos, используя gcc 11.4
Команды, которые я пробовал:

Код: Выделить всё

g++ -fopenmp-simd -O2 -S simd_reduction.cpp
g++ -fopenmp-simd -O2 -mavx2 -march=native -S simd_reduction.cpp

Код:

Код: Выделить всё

#include 

float dot_product_simd(const float a[], const float b[], int n) {
float dot = 0.0;
#pragma omp parallel for simd reduction(+:dot)
for (int i = 0; i < n; i++) {
dot += a[i] * b[i];
}
return dot;
}

void multiply_arrays(const float a[], const float b[], float c[], int n) {
#pragma omp parallel for simd safelen(8)
for (int i = 0; i < n; i++) {
c[i] = a[i] * b[i];
}
}

Мульти_массивы работают с инструкциями avx2, заданными -fopenmp-simd.
При уменьшении скалярного произведения используются только регистры xmm, поэтому выполняются только 128-битные математические операции.
Исправлено ли это в более поздних версиях, нужно ли что-то еще сделать?

Подробнее здесь: https://stackoverflow.com/questions/791 ... this-earli

1730055945

Anonymous

Я использую popos, используя gcc 11.4
Команды, которые я пробовал:
[code]g++ -fopenmp-simd -O2 -S simd_reduction.cpp
g++ -fopenmp-simd -O2 -mavx2 -march=native -S simd_reduction.cpp
[/code]
Код:
[code]#include 

float dot_product_simd(const float a[], const float b[], int n) {
float dot = 0.0;
#pragma omp parallel for simd reduction(+:dot)
for (int i = 0; i < n; i++) {
dot += a[i] * b[i];
}
return dot;
}

void multiply_arrays(const float a[], const float b[], float c[], int n) {
#pragma omp parallel for simd safelen(8)
for (int i = 0; i < n; i++) {
c[i] = a[i] * b[i];
}
}
[/code]
Мульти_массивы работают с инструкциями avx2, заданными -fopenmp-simd.
При уменьшении скалярного произведения используются только регистры xmm, поэтому выполняются только 128-битные математические операции.
Исправлено ли это в более поздних версиях, нужно ли что-то еще сделать? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79131275/gcc-11-4-openmp-does-not-seem-to-generate-avx2-instructions-based-on-this-earli[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «C++»