Сравнение целых чисел без знака с использованием AVX2 Intrinsics

Сравнение целых чисел без знака с использованием AVX2 Intrinsics ⇐ C++

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Сравнение целых чисел без знака с использованием AVX2 Intrinsics

Цитата

Сообщение Anonymous » 29 май 2024, 10:28

Я хочу определить пороговые значения больше 15 с помощью инструкций AVX2, но он сравнивает только числа со знаком.

Код: Выделить всё

    __m256i *pIn0, *pIn1,*pOut;
__m256i a, b, thres = _mm256_set1_epi8(15); //Threshold value is set to 15

for (int i = 0; i < nHeight; i++)
{
pIn0 = (__m256i*)(pY1 + i * nStepSize); //buffer 1 having 8 bit unsigned integers
pIn1 = (__m256i*)(pY2 + i * nStepSize); //buffer 2 having 8 bit unsigned integers
pOut = (__m256i*)(pdiffAnd + i * nStepSize);

int wLimit = nWidth / 32;
for (int j = 0; j < wLimit; j++)
{
a = _mm256_lddqu_si256(pIn0++); //32 values of UINT8 type
b = _mm256_lddqu_si256(pIn1++); //32 values of UINT8 type

__m256i diff1 = _mm256_or_si256(_mm256_subs_epu8(a, b), _mm256_subs_epu8(b, a)); //taking their absolute difference

/* here _mm256_cmpgt_epi8 is comparing values assuming 8 bit Signed integers so values greater than 127 are not getting compared */
__m256i diff1Mask = _mm256_cmpgt_epi8(diff1, thres);

__m256i blend1 = _mm256_blendv_epi8(diff1, diff1Mask, diff1Mask);

_mm256_store_si256(pOut++, blend1);
}
}

Я думал, что можно найти все значения меньше 0 и выполнить побитовое ИЛИ с помощью diff1Mask, но также застрял на поиске значений меньше 0.
PS: Я новичок

Подробнее здесь: https://stackoverflow.com/questions/785 ... intrinsics

1716967713

Anonymous

Я хочу определить пороговые значения больше 15 с помощью инструкций AVX2, но он сравнивает только числа со знаком.
[code]    __m256i *pIn0, *pIn1,*pOut;
__m256i a, b, thres = _mm256_set1_epi8(15); //Threshold value is set to 15

for (int i = 0; i < nHeight; i++)
{
pIn0 = (__m256i*)(pY1 + i * nStepSize); //buffer 1 having 8 bit unsigned integers
pIn1 = (__m256i*)(pY2 + i * nStepSize); //buffer 2 having 8 bit unsigned integers
pOut = (__m256i*)(pdiffAnd + i * nStepSize);

int wLimit = nWidth / 32;
for (int j = 0; j < wLimit; j++)
{
a = _mm256_lddqu_si256(pIn0++); //32 values of UINT8 type
b = _mm256_lddqu_si256(pIn1++); //32 values of UINT8 type

__m256i diff1 = _mm256_or_si256(_mm256_subs_epu8(a, b), _mm256_subs_epu8(b, a)); //taking their absolute difference

/* here _mm256_cmpgt_epi8 is comparing values assuming 8 bit Signed integers so values greater than 127 are not getting compared */
__m256i diff1Mask = _mm256_cmpgt_epi8(diff1, thres);

__m256i blend1 = _mm256_blendv_epi8(diff1, diff1Mask, diff1Mask);

_mm256_store_si256(pOut++, blend1);
}
}
[/code]
Я думал, что можно найти все значения меньше 0 и выполнить побитовое ИЛИ с помощью diff1Mask, но также застрял на поиске значений меньше 0.
PS: Я новичок 

Подробнее здесь: [url]https://stackoverflow.com/questions/78547954/comparing-unsigned-integers-using-avx2-intrinsics[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Перетасовка целых чисел AVX2 с типами, отличными от байтовых?

Последнее сообщение Anonymous « 11 ноя 2024, 10:49
Добавлено в форуме C#

Anonymous » 11 ноя 2024, 10:49 » в форуме C#

API для перетасовки поддерживает только байты и сбайты
//
// Summary:
// __m256i _mm256_shuffle_epi8 (__m256i a, __m256i b)
//
// VPSHUFB ymm, ymm, ymm/m256
//
// Parameters:
// value:
//
// mask:
public static Vector256 Shuffle(Vector256 value,...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
11 ноя 2024, 10:49
Почему поведение целочисленного переполнения неопределенное только для целых чисел со знаком, а не для целых чисел без з

Последнее сообщение Anonymous « 20 окт 2024, 07:10
Добавлено в форуме C++

Anonymous » 20 окт 2024, 07:10 » в форуме C++

Цель создания неопределенного поведения переполнения знакового целого числа — разрешить оптимизацию компилятора. Но разве это не в равной степени веский аргумент в пользу неопределенного поведения переполнения беззнакового целого числа?

Подробнее...

0 Ответы

46 Просмотры

Последнее сообщение Anonymous
20 окт 2024, 07:10
Как перегрузить функцию для целых чисел фиксированного размера и целых чисел, определяемых размером, без шаблонов?

Последнее сообщение Anonymous « 25 янв 2025, 10:38
Добавлено в форуме C++

Anonymous » 25 янв 2025, 10:38 » в форуме C++

Я хочу написать функцию одного аргумента с множественными перегрузками для разных типов целочисленных целого числа. Он хочет иметь возможность назвать его как с типами определяемого реализацией размера (подписанный char, shot, int, long, long), так...

0 Ответы

47 Просмотры

Последнее сообщение Anonymous
25 янв 2025, 10:38
Как перегрузить функцию для целых чисел фиксированного размера и целых чисел размера, определяемого реализацией, без шаб

Последнее сообщение Anonymous « 25 янв 2025, 22:09
Добавлено в форуме C++

Anonymous » 25 янв 2025, 22:09 » в форуме C++

Я хочу написать функцию одного аргумента с множественными перегрузками для разных типов целочисленных целого числа. Он хочет иметь возможность назвать его как с типами определяемого реализацией размера (подписанный char, shot, int, long, long), так...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
25 янв 2025, 22:09
Как перегрузить функцию для целых чисел фиксированного размера и целых чисел, определяемых размером, без шаблонов?

Последнее сообщение Anonymous « 26 янв 2025, 16:08
Добавлено в форуме C++

Anonymous » 26 янв 2025, 16:08 » в форуме C++

Я хочу написать функцию одного аргумента с несколькими перегрузками для разных целочисленных типов. Он хочет иметь возможность вызывать его как с типами размера, определяемыми реализацией (подписанный char,shot, int, long, long long), так и с...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
26 янв 2025, 16:08

Вернуться в «C++»