Объясните, почему две реализации имеют такую большую разницу в производительности.

Объясните, почему две реализации имеют такую большую разницу в производительности. ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Объясните, почему две реализации имеют такую большую разницу в производительности.

Цитата

Сообщение Anonymous » 26 ноя 2024, 03:40

Я пытаюсь сравнить производительность между Buffer::AddValueTest() и Buffer::AddValueReference() (вставлено ниже. Полную программу тестирования можно найти по адресу https://gist. github.com/find3kan0/11f2cf220ed452284db48071b1adefa1). Мое тестирование показало неожиданный (для меня) результат: AddValueReference в 8 раз быстрее, чем AddValueTest() с 256 потоками.
При 1 потоке они выполняются довольно близко, но по мере увеличения количества потоков производительность AddValueTest() падает намного быстрее.
Я тестировал его на рабочей станции с AMD Milan (32 ядра), скомпилированной с помощью clang 19.1.0 с флагом -std=c++17 -O3.
Профилирование показывает, что AddValueTest() тратит гораздо больше времени на получение и снятие блокировки мьютекса. Я ожидаю, что AddValueTest() будет работать быстрее, если вынести логику отчетов по метрикам из области блокировки - или, по крайней мере, производительность должна быть примерно эквивалентной. В чем может быть причина проблем с производительностью?
bool AddValueTest(T val) {
bool is_full = false;
size_t buffer_size = 0;
{
absl::MutexLock lock(&mu_);
if (stopped_) return false;

is_full = buffer_.full();
if (is_full) {
buffer_.pop_front();
}
buffer_.push_back(std::move(val));
buffer_size = buffer_.size();
}

if (is_full) {
metric_reporter->IncDroppedValues();
}
metric_reporter->ReportQueueLength(buffer_size);
return !is_full;
}

bool AddValueReference(T val) {
absl::MutexLock lock(&mu_);
if (stopped_) return false;

bool is_full = buffer_.full();
if (is_full) {
buffer_.pop_front();
metric_reporter->IncDroppedValues();
}

buffer_.push_back(std::move(val));
metric_reporter->ReportQueueLength(buffer_.size());
return !is_full;
}

Подробнее здесь: https://stackoverflow.com/questions/792 ... difference

1732581621

Anonymous

Я пытаюсь сравнить производительность между Buffer::AddValueTest() и Buffer::AddValueReference() (вставлено ниже. Полную программу тестирования можно найти по адресу https://gist. github.com/find3kan0/11f2cf220ed452284db48071b1adefa1). Мое тестирование показало неожиданный (для меня) результат: AddValueReference в 8 раз быстрее, чем AddValueTest() с 256 потоками.
При 1 потоке они выполняются довольно близко, но по мере увеличения количества потоков производительность AddValueTest() падает намного быстрее.
Я тестировал его на рабочей станции с AMD Milan (32 ядра), скомпилированной с помощью clang 19.1.0 с флагом -std=c++17 -O3.
Профилирование показывает, что AddValueTest() тратит гораздо больше времени на получение и снятие блокировки мьютекса. Я ожидаю, что AddValueTest() будет работать быстрее, если вынести логику отчетов по метрикам из области блокировки - или, по крайней мере, производительность должна быть примерно эквивалентной. В чем может быть причина проблем с производительностью?
  bool AddValueTest(T val) {
bool is_full = false;
size_t buffer_size = 0;
{
absl::MutexLock lock(&mu_);
if (stopped_) return false;

is_full = buffer_.full();
if (is_full) {
buffer_.pop_front();
}
buffer_.push_back(std::move(val));
buffer_size = buffer_.size();
}

if (is_full) {
metric_reporter->IncDroppedValues();
}
metric_reporter->ReportQueueLength(buffer_size);
return !is_full;
}

bool AddValueReference(T val) {
absl::MutexLock lock(&mu_);
if (stopped_) return false;

bool is_full = buffer_.full();
if (is_full) {
buffer_.pop_front();
metric_reporter->IncDroppedValues();
}

buffer_.push_back(std::move(val));
metric_reporter->ReportQueueLength(buffer_.size());
return !is_full;
}
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79221296/explain-why-the-two-implementations-have-so-much-performance-difference[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему декодирование кадра в формате *.jpeg с использованием nvJPEG добавляет такую большую задержку к визуализированн

Последнее сообщение Anonymous « 28 май 2024, 19:43
Добавлено в форуме C++

Anonymous » 28 май 2024, 19:43 » в форуме C++

Я пытаюсь добиться следующего:

Захват кадров с моей карты захвата DeckLink с помощью DeckLink SDK (1920 x 1080, 60 кадров в секунду, 8 бит на канал) кадры)
Закодируйте их с помощью nvJPEG.
Декодируйте их снова, также используя nvJPEG....

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
28 май 2024, 19:43
Объясните разницу между двумя подходами к вызову асинхронных операций.

Последнее сообщение Anonymous « 03 июл 2024, 02:58
Добавлено в форуме C#

Anonymous » 03 июл 2024, 02:58 » в форуме C#

У меня есть два варианта кода, которые будут представлены ниже.
Задача кода заключается в следующем: у меня есть два URL-адреса, по которым я делаю HTTP-запрос Get, и Я хочу получить оттуда контент.
В первом случае я использую Task.WhenAll и...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 02:58
Объясните разницу между двумя подходами к вызову асинхронных операций.

Последнее сообщение Anonymous « 03 июл 2024, 09:09
Добавлено в форуме C#

Anonymous » 03 июл 2024, 09:09 » в форуме C#

У меня есть два варианта кода, которые будут представлены ниже.
Задача кода заключается в следующем: у меня есть два URL-адреса, по которым я делаю HTTP-запрос Get, и Я хочу получить оттуда контент.
В первом случае я использую Task.WhenAll и...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 09:09
Объясните разницу между двумя подходами к вызову асинхронных операций

Последнее сообщение Anonymous « 04 июл 2024, 01:19
Добавлено в форуме C#

Anonymous » 04 июл 2024, 01:19 » в форуме C#

У меня есть два варианта кода, которые будут представлены ниже.
Задача кода заключается в следующем: у меня есть два URL-адреса, по которым я делаю HTTP-запрос Get, и Я хочу получить оттуда контент.
В первом случае я использую Task.WhenAll и...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 01:19
Пожалуйста, объясните «установленную разницу» в Python

Последнее сообщение Anonymous « 05 дек 2024, 17:09
Добавлено в форуме Python

Anonymous » 05 дек 2024, 17:09 » в форуме Python

Пытаясь изучить Python, я столкнулся со следующим:

>>> set('spam') - set('ham')
set( )

Почему установлено( ) - я имею в виду: почему отсутствует 'h'?

Подробнее здесь:

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
05 дек 2024, 17:09

Вернуться в «C++»

Объясните, почему две реализации имеют такую ​​большую разницу в производительности. ⇐ C++

Быстрый ответ

Объясните, почему две реализации имеют такую большую разницу в производительности. ⇐ C++