Как использовать STD :: SIMD в качестве ввода функций Intrinsics SIMD? - Цифровое Кемерово

Как использовать STD :: SIMD в качестве ввода функций Intrinsics SIMD? ⇐ C++

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как использовать STD :: SIMD в качестве ввода функций Intrinsics SIMD?

Цитата

Сообщение Anonymous » 11 апр 2025, 10:16

На данный момент функции, предоставленные std :: datapar :: simd и std :: experimental :: simd несколько ограничены, особенно когда речь идет о перетасовке элементов или нетривиальной нагрузки. Допустим, у меня есть следующее: < /p>

Код: Выделить всё

std::array a = {
0, 100, 200, 300, 400, 500, 600, 700,
800, 900, 1000, 1100, 1200, 1300, 1400, 1500
};
std::array vindex_data = {3, 7, 11, 15};
unsigned long long int* base_addr = a.data();
std::experimental::fixed_size_simd vindex(
vindex_data.data(),
std::experimental::element_aligned
);
int scale = sizeof(unsigned long long int);
std::experimental::fixed_size_simd v;
/* And then I would like to load v using _mm256_i32gather_epi64*/
v = _mm256_i32gather_epi64(base_addr, vindex, scale); // This will not compile

Есть ли какой-либо нестандартный способ, который бы работал на GCC и clang , чтобы вызвать внутренние функции SIMD на std :: datapar :: simd и std :: experimental :: simd (может>

Подробнее здесь: https://stackoverflow.com/questions/795 ... -functions

Реклама

1744355792

Anonymous

 На данный момент функции, предоставленные std :: datapar :: simd  и std :: experimental :: simd  несколько ограничены, особенно когда речь идет о перетасовке элементов или нетривиальной нагрузки. Допустим, у меня есть следующее: < /p>
[code]std::array a = {
0, 100, 200, 300, 400, 500, 600, 700,
800, 900, 1000, 1100, 1200, 1300, 1400, 1500
};
std::array vindex_data = {3, 7, 11, 15};
unsigned long long int* base_addr = a.data();
std::experimental::fixed_size_simd vindex(
vindex_data.data(),
std::experimental::element_aligned
);
int scale = sizeof(unsigned long long int);
std::experimental::fixed_size_simd v;
/* And then I would like to load v using _mm256_i32gather_epi64*/
v = _mm256_i32gather_epi64(base_addr, vindex, scale); // This will not compile
[/code]
Есть ли какой-либо нестандартный способ, который бы работал на GCC  и clang , чтобы вызвать внутренние функции SIMD на std :: datapar :: simd  и std :: experimental :: simd  (может> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79568001/how-to-use-stdsimd-as-input-of-simd-intrinsics-functions[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

`std::map<std::string, enum{1, 2, 3, 4}>` (или std::map<std::string, tuple<bool, bool>>`) кэширует` против `std: :set<st

Последнее сообщение Anonymous « 20 май 2024, 22:02
Добавлено в форуме C++

Anonymous » 20 май 2024, 22:02 » в форуме C++

Некоторые реализации векторов (например, используют 1 бит на бит (в отличие от 8 бит, как в старом std::vector).
Новое В черновиках C++ также есть такие вещи, как std::bitset ( ).
Содержит ли новый черновик C++ разрешить std::map (2-битное значение)...

0 Ответы

323 Просмотры

Последнее сообщение Anonymous
20 май 2024, 22:02
Сравнение целых чисел без знака с использованием AVX2 Intrinsics

Последнее сообщение Anonymous « 29 май 2024, 10:28
Добавлено в форуме C++

Anonymous » 29 май 2024, 10:28 » в форуме C++

Я хочу определить пороговые значения больше 15 с помощью инструкций AVX2, но он сравнивает только числа со знаком.
__m256i *pIn0, *pIn1,*pOut;
__m256i a, b, thres = _mm256_set1_epi8(15); //Threshold value is set to 15

for (int i = 0; i < nHeight;...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
29 май 2024, 10:28
Ускорение умножения матрицы-вектора с помощью ARM Neon Intrinsics на Raspberry Pi 4

Последнее сообщение Anonymous « 08 янв 2025, 04:13
Добавлено в форуме C++

Anonymous » 08 янв 2025, 04:13 » в форуме C++

Мне нужно оптимизировать умножение матрицы на вектор. Данные выглядят следующим образом:

Вектор имеет 81 столбец.
Матрица имеет 90 000 строк и 81 столбец и уже транспонирована. . Таким образом, можно использовать скалярное произведение по...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
08 янв 2025, 04:13
System.Numerics.Vector или System.Runtime.Intrinsics.Vector128

Последнее сообщение Anonymous « 24 фев 2025, 12:59
Добавлено в форуме C#

Anonymous » 24 фев 2025, 12:59 » в форуме C#

Документация как для векторных, так и для векторных структур128 действительно похожа, и есть метод Asvector/Asvector128 для переключения между ними. >
Я посмотрел реализацию этих двух структур и заметил атрибуты оптимизации для JIT в дополнение к...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 12:59
System.Numerics.Vector или System.Runtime.Intrinsics.Vector128

Последнее сообщение Anonymous « 24 фев 2025, 13:45
Добавлено в форуме C#

Anonymous » 24 фев 2025, 13:45 » в форуме C#

Документация как для векторных, так и для векторных структур128 действительно похожа, и есть метод Asvector/Asvector128 для переключения между ними. >
Я посмотрел реализацию этих двух структур и заметил атрибуты оптимизации для JIT в дополнение к...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 13:45

Вернуться в «C++»

Programmiererforum