Пользовательские функции C++ AVX2 (например, «exp») не работают в Windows (но работают в Linux).

Пользовательские функции C++ AVX2 (например, «exp») не работают в Windows (но работают в Linux). ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Пользовательские функции C++ AVX2 (например, «exp») не работают в Windows (но работают в Linux).

Цитата

Сообщение Anonymous » 04 янв 2025, 19:21

Этот пост чем-то связан с постом, который я написал пару дней назад:
C++ AVX2 Function Pointers/std::function не работает в Windows (но работает в Linux)< /p>
С тех пор, благодаря полезным комментариям, я решил эту проблему; с помощью:

Код: Выделить всё

// Simple test function that just multiplies vector by 2
__m256d  test_simple_AVX2(const __m256d x) {

ALIGN32 const __m256d two = _mm256_set1_pd(2.0);
ALIGN32 const __m256d res = _mm256_mul_pd(x, two);
return res;

}

Вместо:

Код: Выделить всё

// Simple test function that just multiplies vector by 2
__m256d  test_simple_AVX2(const __m256d x) {

const __m256d two = _mm256_set1_pd(2.0);
const __m256d res = _mm256_mul_pd(x, two);
return res;

}

Где ALIGN32 определяется как:

Код: Выделить всё

#ifdef _MSC_VER
#define ALIGN32 __declspec(align(32))
#else
#define ALIGN32 alignas(32)
#endif

Однако мои более сложные функции AVX2, которые отлично работают в Linux, по-прежнему не работают (даже при прямом вызове) и аварийно завершают работу. Я получаю прерванный сеанс и использую C++ через Rcpp.
Например, вот моя функция exp:

Код: Выделить всё

// Adapted from: https://stackoverflow.com/questions/48863719/fastest-implementation-of-exponential-function-using-avx
// added   (optional) extra degree(s) for poly approx (oroginal float fn had 4 degrees) - using "minimaxApprox" R package to find coefficient terms
// R code:    minimaxApprox::minimaxApprox(fn = exp, lower = -0.346573590279972643113, upper = 0.346573590279972643113, degree = 5, basis ="Chebyshev")
inline    __m256d fast_exp_1_wo_checks_AVX2 VECTORCALL(const __m256d x)  {

_mm256_zeroupper();  // Reset AVX state

ALIGN32  __m256d const x_aligned = x;

ALIGN32  __m256d const exp_l2e = _mm256_set1_pd (1.442695040888963387); /* log2(e) */
ALIGN32  __m256d const exp_l2h = _mm256_set1_pd (-0.693145751999999948367); /* -log(2)_hi */
ALIGN32  __m256d const exp_l2l = _mm256_set1_pd (-0.00000142860676999999996193); /* -log(2)_lo */

// /* coefficients for core approximation to exp() in [-log(2)/2, log(2)/2] */
ALIGN32  __m256d const exp_c0 =     _mm256_set1_pd(0.00000276479776161191821278);
ALIGN32  __m256d const exp_c1 =     _mm256_set1_pd(0.0000248844480527491290235);
ALIGN32  __m256d const exp_c2 =     _mm256_set1_pd(0.000198411488032534342194);
ALIGN32  __m256d const exp_c3 =     _mm256_set1_pd(0.00138888017711994078175);
ALIGN32  __m256d const exp_c4 =     _mm256_set1_pd(0.00833333340524595143906);
ALIGN32  __m256d const exp_c5 =     _mm256_set1_pd(0.0416666670404215802592);
ALIGN32  __m256d const exp_c6 =     _mm256_set1_pd(0.166666666664891632843);
ALIGN32  __m256d const exp_c7 =     _mm256_set1_pd(0.499999999994389376923);
ALIGN32  __m256d const exp_c8 =     _mm256_set1_pd(1.00000000000001221245);
ALIGN32  __m256d const exp_c9 =     _mm256_set1_pd(1.00000000000001332268);

ALIGN32  __m256d const input  = x_aligned;

/* exp(x) = 2^i * e^f; i = rint (log2(e) * a), f = a - log(2) * i */
ALIGN32  __m256d const t = _mm256_mul_pd(x_aligned, exp_l2e);      /* t = log2(e) * a */
///  const __m256i i = _mm256_cvttpd_epi32(t);       /* i = (int)rint(t) */
ALIGN32  __m256i const i = avx2_cvtpd_epi64(t);
// const __m256d x_2 = _mm256_round_pd(t, _MM_FROUND_TO_NEAREST_INT) ; // ((0

Подробнее здесь: [url]https://stackoverflow.com/questions/79328976/c-avx2-custom-functions-e-g-exp-not-working-on-windows-but-work-on-linu[/url]

1736007716

Anonymous

Этот пост чем-то связан с постом, который я написал пару дней назад:
C++ AVX2 Function Pointers/std::function не работает в Windows (но работает в Linux)< /p>
С тех пор, благодаря полезным комментариям, я решил эту проблему; с помощью:
[code]// Simple test function that just multiplies vector by 2
__m256d  test_simple_AVX2(const __m256d x) {

ALIGN32 const __m256d two = _mm256_set1_pd(2.0);
ALIGN32 const __m256d res = _mm256_mul_pd(x, two);
return res;

}
[/code]
Вместо:
[code]// Simple test function that just multiplies vector by 2
__m256d  test_simple_AVX2(const __m256d x) {

const __m256d two = _mm256_set1_pd(2.0);
const __m256d res = _mm256_mul_pd(x, two);
return res;

}
[/code]
Где ALIGN32 определяется как:
[code]#ifdef _MSC_VER
#define ALIGN32 __declspec(align(32))
#else
#define ALIGN32 alignas(32)
#endif

[/code]
Однако мои более сложные функции AVX2, которые отлично работают в Linux, по-прежнему не работают (даже при прямом вызове) и аварийно завершают работу. Я получаю прерванный сеанс и использую C++ через Rcpp.  
Например, вот моя функция exp:
[code]// Adapted from: https://stackoverflow.com/questions/48863719/fastest-implementation-of-exponential-function-using-avx
// added   (optional) extra degree(s) for poly approx (oroginal float fn had 4 degrees) - using "minimaxApprox" R package to find coefficient terms
// R code:    minimaxApprox::minimaxApprox(fn = exp, lower = -0.346573590279972643113, upper = 0.346573590279972643113, degree = 5, basis ="Chebyshev")
inline    __m256d fast_exp_1_wo_checks_AVX2 VECTORCALL(const __m256d x)  {

_mm256_zeroupper();  // Reset AVX state

ALIGN32  __m256d const x_aligned = x;

ALIGN32  __m256d const exp_l2e = _mm256_set1_pd (1.442695040888963387); /* log2(e) */
ALIGN32  __m256d const exp_l2h = _mm256_set1_pd (-0.693145751999999948367); /* -log(2)_hi */
ALIGN32  __m256d const exp_l2l = _mm256_set1_pd (-0.00000142860676999999996193); /* -log(2)_lo */

// /* coefficients for core approximation to exp() in [-log(2)/2, log(2)/2] */
ALIGN32  __m256d const exp_c0 =     _mm256_set1_pd(0.00000276479776161191821278);
ALIGN32  __m256d const exp_c1 =     _mm256_set1_pd(0.0000248844480527491290235);
ALIGN32  __m256d const exp_c2 =     _mm256_set1_pd(0.000198411488032534342194);
ALIGN32  __m256d const exp_c3 =     _mm256_set1_pd(0.00138888017711994078175);
ALIGN32  __m256d const exp_c4 =     _mm256_set1_pd(0.00833333340524595143906);
ALIGN32  __m256d const exp_c5 =     _mm256_set1_pd(0.0416666670404215802592);
ALIGN32  __m256d const exp_c6 =     _mm256_set1_pd(0.166666666664891632843);
ALIGN32  __m256d const exp_c7 =     _mm256_set1_pd(0.499999999994389376923);
ALIGN32  __m256d const exp_c8 =     _mm256_set1_pd(1.00000000000001221245);
ALIGN32  __m256d const exp_c9 =     _mm256_set1_pd(1.00000000000001332268);

ALIGN32  __m256d const input  = x_aligned;

/* exp(x) = 2^i * e^f; i = rint (log2(e) * a), f = a - log(2) * i */
ALIGN32  __m256d const t = _mm256_mul_pd(x_aligned, exp_l2e);      /* t = log2(e) * a */
///  const __m256i i = _mm256_cvttpd_epi32(t);       /* i = (int)rint(t) */
ALIGN32  __m256i const i = avx2_cvtpd_epi64(t);
// const __m256d x_2 = _mm256_round_pd(t, _MM_FROUND_TO_NEAREST_INT) ; // ((0

Подробнее здесь: [url]https://stackoverflow.com/questions/79328976/c-avx2-custom-functions-e-g-exp-not-working-on-windows-but-work-on-linu[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Пользовательские функции C++ AVX2 (например, «exp») не работают в Windows (но работают в Linux).

Последнее сообщение Anonymous « 04 янв 2025, 17:14
Добавлено в форуме C++

Anonymous » 04 янв 2025, 17:14 » в форуме C++

Этот пост чем-то связан с постом, который я написал пару дней назад:
C++ AVX2 Function Pointers/std::function не работает в Windows (но работает в Linux)
С тех пор, благодаря полезным комментариям, я решил эту проблему; с помощью:
// Simple test...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
04 янв 2025, 17:14
Почему программа, скомпилированная с одинаковыми функциями оптимизации (AVX2, OpenMP), работает в Linux гораздо медленне

Последнее сообщение Гость « 30 апр 2024, 04:09
Добавлено в форуме C++

Гость » 30 апр 2024, 04:09 » в форуме C++

Обновление2:
При необходимости вы можете найти исходные коды ниже по ссылке на github. Вы также можете найти полные и точные изменения, которые я внес для воспроизведения проблемы, а также журналы программы. Но теперь они находятся в истории...

0 Ответы

42 Просмотры

Последнее сообщение Гость
30 апр 2024, 04:09
Как включить avx/avx2 для Ubuntu в VirtualBox в Windows 11?

Последнее сообщение Anonymous « 17 окт 2024, 15:20
Добавлено в форуме Linux

Anonymous » 17 окт 2024, 15:20 » в форуме Linux

Я не могу включить avx2 на гостевой виртуальной машине Ubuntu 22.04 в VirtualBox7. Я использовал все способы, которые обсуждались на разных платформах Stack, но проблема остается, и ничего не отображается, когда я выполняю grep avx /proc/cpuinfo в...

0 Ответы

62 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 15:20
Получение значения BER (exp - float) из шестнадцатеричного значения

Последнее сообщение Anonymous « 20 май 2024, 22:38
Добавлено в форуме C#

Anonymous » 20 май 2024, 22:38 » в форуме C#

У меня есть шестнадцатеричное значение 0x4995
которое, как я знаю, преобразуется в это значение: 4.050000e-13 (BER — частота ошибок по битам) (с плавающей запятой),
Мне нужна помощь, чтобы понять алгоритм для этого преобразования
из небольшого...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
20 май 2024, 22:38
DimensionalityError при вычислении экспоненциального значения «exp(x)» в единицах пинты

Последнее сообщение Anonymous « 25 сен 2024, 11:59
Добавлено в форуме Python

Anonymous » 25 сен 2024, 11:59 » в форуме Python

Я пытаюсь вычислить экспоненциальное значение exp с помощью переменной python pint, включающей единицу измерения.
import pint
var = 0.5 * unit_reg.minute
math.exp(-var)

при этом я получаю сообщение об ошибке: DimensionalityError: невозможно...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 11:59

Вернуться в «C++»