CPU_CORE против CPU_ATOM в PERFC++

Программы на C++. Форум разработчиков
Ответить
Anonymous
 CPU_CORE против CPU_ATOM в PERF

Сообщение Anonymous »

Я строю пример, который показывает эффект неправильных отраслей ветви. При использовании perf stat я получаю следующие результаты:

Здесь я могу видеть некоторые метрики дважды, один раз для cpu_atom и один раз для cpu_ctry_ctry. В чем разница между этими двумя? This is somewhat confusing, since I would expect numbers for cpu_atom to be bigger than numbers for cpu_core
It's also a bit confusing how the two, cpu_core and cpu_atom metrics differ relative to each other on multiple runs:

Это совсем другая фракция, чем предыдущий прогон. src = "https://i.sstatic.net/gsrpxxoq.png"/>
И есть этот запуск ...
imbe.i%. ошибка. Это 110 238 856/57,711,854, которое представляет собой CPU_CORE/BRANCH-PINSES /CPU_ATOM/BREANTS . Если это не ошибка, мне интересно, почему метрики делятся от CPU_CORE по метрикам от CPU_ATOM .
Просто для справки, вот код исполняемого ran:
#include

#include
#include

void test(benchmark::State& s) {
const auto N = s.range(0);
std::vector v1(N), v2(N), c(N);

srand(1);
std::generate(v1.begin(), v1.end(), [] { return rand(); });
std::generate(v2.begin(), v2.end(), [] { return rand(); });
#ifdef HIT
std::generate(c.begin(), c.end(), [] { return rand() >= 0; });
#else
std::generate(c.begin(), c.end(), [] { return rand() & 1; });
#endif

for (auto _ : s) {
unsigned long result = 0;
for (int i = 0; i < N; i++) {
if (c) {
result += v1;
} else {
result *= v2;
}
}
benchmark::DoNotOptimize(result);
benchmark::ClobberMemory();
}
}

BENCHMARK(test)->Arg(1
Скомпилируется как следующее: < /p>
g++ branch_prediction.cpp -o miss -g3 -O3 -mavx2 -lbenchmark


Подробнее здесь: https://stackoverflow.com/questions/795 ... om-in-perf
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «C++»