Побитовый сдвиг в AVX512 - Цифровое Кемерово

Побитовый сдвиг в AVX512 ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Сообщение Anonymous » 16 апр 2024, 16:13

Я хочу использовать встроенные инструкции или инструкции ассемблера для сдвига 64 8-битных элементов на 1 позицию. Например, это (1, 2, 3,...., 63, 64) В этом (0, 1, 2, 3,...,62, 63) без потери элементов.
для 32 8-битных элементов и AVX, AVX2 можно сделать так:
src = (1,2,3,...,63, 64),
mask = ( 0, 0, ...,255,...,0,0) (нужно, так как мы потеряли 1 элемент),

Код: Выделить всё

a = _mm256_sli_si256(src, 1);
src = _mm256_and_si256(src, mask);
src = _mm256_permute2f128_si256(src, src, 1);
src = _mm256_srli_si256(src, 15);
src = _mm256_add_epi16(a, src);

в результате src = (0, 1, 2, 3,...,62,63)

Подробнее здесь: https://stackoverflow.com/questions/783 ... -in-avx512

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «C++»