Я пытаюсь сравнить производительность между Buffer::AddValueTest() и Buffer::AddValueReference() (вставлено ниже. Полную программу тестирования можно найти по адресу https://gist. github.com/find3kan0/11f2cf220ed452284db48071b1adefa1). Мое тестирование показало неожиданный (для меня) результат: AddValueReference в 8 раз быстрее, чем AddValueTest() с 256 потоками.
При 1 потоке они выполняются довольно близко, но по мере увеличения количества потоков производительность AddValueTest() падает намного быстрее.
Я тестировал его на рабочей станции с AMD Milan (32 ядра), скомпилированной с помощью clang 19.1.0 с флагом -std=c++17 -O3.
Профилирование показывает, что AddValueTest() тратит гораздо больше времени на получение и снятие блокировки мьютекса. Я ожидаю, что AddValueTest() будет работать быстрее, если вынести логику отчетов по метрикам из области блокировки - или, по крайней мере, производительность должна быть примерно эквивалентной. В чем может быть причина проблем с производительностью?
bool AddValueTest(T val) {
bool is_full = false;
size_t buffer_size = 0;
{
absl::MutexLock lock(&mu_);
if (stopped_) return false;
is_full = buffer_.full();
if (is_full) {
buffer_.pop_front();
}
buffer_.push_back(std::move(val));
buffer_size = buffer_.size();
}
if (is_full) {
metric_reporter->IncDroppedValues();
}
metric_reporter->ReportQueueLength(buffer_size);
return !is_full;
}
bool AddValueReference(T val) {
absl::MutexLock lock(&mu_);
if (stopped_) return false;
bool is_full = buffer_.full();
if (is_full) {
buffer_.pop_front();
metric_reporter->IncDroppedValues();
}
buffer_.push_back(std::move(val));
metric_reporter->ReportQueueLength(buffer_.size());
return !is_full;
}
Подробнее здесь: https://stackoverflow.com/questions/792 ... difference
Объясните, почему две реализации имеют такую большую разницу в производительности. ⇐ C++
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение