Я пытался работать над кодом AVX512. Работая над тем же, пытался найти функцию, похожую на _mm256_sign_epi8 в AVX512, но не смог найти эквивалент. Было бы очень полезно, если бы мы нашли подобную инструкцию. Есть ли эквивалентная инструкция или какой-либо другой альтернативный способ сделать это для AVX512 с аналогичным/меньшим CPI/задержкой? Спасибо.
Пример функции AVX2
В зависимости от знака элементов y также обновляется знак элементов x
Подробнее здесь:
https://stackoverflow.com/questions/773 ... -in-avx512