У меня есть две функции, подсчитывающие появление целевого символа в данном входном буфере. Функции различаются только тем, как они передают результат обратно вызывающему объекту; один возвращает результат, а другой записывает в переменную, переданную по ссылке.
Код: Выделить всё
#include
#define BUF_LEN 0x1000
size_t check_count1(const char* buf, char target) {
size_t count = 0;
for (size_t i = 0; i < BUF_LEN; i++) {
if (buf[i] == target) {
count++;
}
}
return count;
}
void check_count2(const char* buf, char target, size_t& count) {
for (size_t i = 0; i < BUF_LEN; i++) {
if (buf[i] == target) {
count++;
}
}
}
Меня озадачивает то, как Clang и GCC генерируют код для этих двух функций. Цикл в check_count1 векторизован, а в check_count2 — нет. Сначала я думал, что это связано с псевдонимами указателей во втором случае, но указание __restrict не имеет никакого эффекта. Вот ссылка на проводник компилятора.
Старый компилятор ICC прекрасно справлялся с обоими циклами. Что изменилось?
Подробнее здесь:
https://stackoverflow.com/questions/798 ... imple-loop