Производительность графического процессора хуже, чем производительность процессора по выводам YOLO

Производительность графического процессора хуже, чем производительность процессора по выводам YOLO ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Производительность графического процессора хуже, чем производительность процессора по выводам YOLO

Цитата

Сообщение Anonymous » 31 июл 2024, 20:13

Я использую пакет YoloDotNet NuGet для проверки производительности моделей YOLO. Я провожу это тестирование для своей дипломной работы. Однако я столкнулся с проблемой, когда производительность графического процессора значительно хуже, чем производительность процессора.

Проблема в том, что производительность для первых выводов 50/60 действительно хороши (например, 20 мс), а затем начинают ухудшаться, пока время не стабилизируется около 70/75 мс на изображение. Я не понимаю, почему производительность при этом ухудшается.

Окружающая среда:

Версия YoloDotNet: v2.0
ЦП: AMD ryzen 7 7800X3D
Графический процессор: 4070 super
< li>Версия CUDA/cuDNN: cuda 11.8 и cudnn 8.9.7
Версия .NET: 8

Шаги воспроизвести:

Код: Выделить всё

var sw = new Stopwatch();
for (var i = 0; i < 500; i++)
{
var file = $@"C:\Users\Utente\Documents\assets\images\input\frame_{i}.jpg";

using var image = SKImage.FromEncodedData(file);
sw.Restart();
var results = yolo.RunObjectDetection(image, confidence: 0.25, iou: 0.7);
sw.Stop();
image.Draw(results);

image.Save(file.Replace("input", $"output_{yolo_version}{version}_{target}").Replace(".jpg", $"_detect_{yolo_version}{version}_{target}.jpg"),
SKEncodedImageFormat.Jpeg);
times.Add(sw.Elapsed.TotalMilliseconds);
Console.WriteLine($"Time taken for image {i}: {sw.Elapsed.TotalMilliseconds:F2} ms");

Вот так я измеряю время обнаружения.
Чтобы загрузить модель, я использую эту настройку в случае с графическим процессором< /p>

Код: Выделить всё

yolo = new Yolo(new YoloOptions
{
OnnxModel = @$"C:\Users\Utente\Documents\assets\model\yolov{yolo_version}{version}_{target}.onnx",
ModelType = ModelType.ObjectDetection,  // Model type
Cuda = true,                           // Use CPU or CUDA for GPU accelerated inference. Default = true
GpuId = 0,                               // Select Gpu by id. Default = 0
PrimeGpu = true,                       // Pre-allocate GPU before first. Default = false
});
Console.WriteLine(yolo.OnnxModel.ModelType);
Console.WriteLine($"Using GPU for version {yolo_version}{version}");

Показатели производительности с использованием yolov8:

Код: Выделить всё

CPU Inference Time:
Total time taken for version m: 25693 ms

Average time per image for version m: 51.25 ms

GPU Inference Time:
Total time taken for version m: 34459.73 ms

Average time per image for version m: 69.74 ms

Я хотел бы опубликовать графики времени, но у меня недостаточно репутации
Проблема проявляется для разных размеров модели. Для простоты визуализации я напечатал только размер m.
Ожидаемое поведение заключается в том, что вывод с использованием графического процессора должен быть быстрее, чем вывод с использованием ЦП.
Но производительность не так велика. улучшение использования графического процессора.

Подробнее здесь: https://stackoverflow.com/questions/788 ... inferences

1722446037

Anonymous

Я использую пакет YoloDotNet NuGet для проверки производительности моделей YOLO. Я провожу это тестирование для своей дипломной работы. Однако я столкнулся с проблемой, когда производительность графического процессора значительно хуже, чем производительность процессора.

Проблема в том, что производительность для первых выводов 50/60 действительно хороши (например, 20 мс), а затем начинают ухудшаться, пока время не стабилизируется около 70/75 мс на изображение. Я не понимаю, почему производительность при этом ухудшается.

Окружающая среда:
[list]
[*]Версия YoloDotNet: v2.0
[*]ЦП: AMD ryzen 7 7800X3D
[*]Графический процессор: 4070 super
< li>Версия CUDA/cuDNN: cuda 11.8 и cudnn 8.9.7
[*]Версия .NET: 8
[/list]
Шаги воспроизвести:
[code]var sw = new Stopwatch();
for (var i = 0; i < 500; i++)
{
var file = $@"C:\Users\Utente\Documents\assets\images\input\frame_{i}.jpg";

using var image = SKImage.FromEncodedData(file);
sw.Restart();
var results = yolo.RunObjectDetection(image, confidence: 0.25, iou: 0.7);
sw.Stop();
image.Draw(results);

image.Save(file.Replace("input", $"output_{yolo_version}{version}_{target}").Replace(".jpg", $"_detect_{yolo_version}{version}_{target}.jpg"),
SKEncodedImageFormat.Jpeg);
times.Add(sw.Elapsed.TotalMilliseconds);
Console.WriteLine($"Time taken for image {i}: {sw.Elapsed.TotalMilliseconds:F2} ms");
[/code]
Вот так я измеряю время обнаружения.
Чтобы загрузить модель, я использую эту настройку в случае с графическим процессором< /p>
[code]yolo = new Yolo(new YoloOptions
{
OnnxModel = @$"C:\Users\Utente\Documents\assets\model\yolov{yolo_version}{version}_{target}.onnx",
ModelType = ModelType.ObjectDetection,  // Model type
Cuda = true,                           // Use CPU or CUDA for GPU accelerated inference. Default = true
GpuId = 0,                               // Select Gpu by id. Default = 0
PrimeGpu = true,                       // Pre-allocate GPU before first. Default = false
});
Console.WriteLine(yolo.OnnxModel.ModelType);
Console.WriteLine($"Using GPU for version {yolo_version}{version}");
[/code]
Показатели производительности с использованием yolov8:
[code]CPU Inference Time:
Total time taken for version m: 25693 ms

Average time per image for version m: 51.25 ms

GPU Inference Time:
Total time taken for version m: 34459.73 ms

Average time per image for version m: 69.74 ms
[/code]
Я хотел бы опубликовать графики времени, но у меня недостаточно репутации
Проблема проявляется для разных размеров модели. Для простоты визуализации я напечатал только размер m.
Ожидаемое поведение заключается в том, что вывод с использованием графического процессора должен быть быстрее, чем вывод с использованием ЦП.
Но производительность не так велика. улучшение использования графического процессора. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78802177/gpu-performance-worse-than-cpu-performance-on-yolo-inferences[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Производительность графического процессора хуже, чем производительность процессора по выводам YOLO

Последнее сообщение Anonymous « 27 июл 2024, 21:33
Добавлено в форуме C#

Anonymous » 27 июл 2024, 21:33 » в форуме C#

Я использую пакет YoloDotNet NuGet для проверки производительности моделей YOLO. Я провожу это тестирование для своей дипломной работы. Однако я столкнулся с проблемой, когда производительность графического процессора значительно хуже, чем...

0 Ответы

60 Просмотры

Последнее сообщение Anonymous
27 июл 2024, 21:33
Производительность графического процессора хуже, чем производительность процессора по выводам YOLO

Последнее сообщение Anonymous « 28 июл 2024, 02:55
Добавлено в форуме C#

Anonymous » 28 июл 2024, 02:55 » в форуме C#

Я использую пакет YoloDotNet NuGet для проверки производительности моделей YOLO. Я провожу это тестирование для своей дипломной работы. Однако я столкнулся с проблемой, когда производительность графического процессора значительно хуже, чем...

0 Ответы

59 Просмотры

Последнее сообщение Anonymous
28 июл 2024, 02:55
Производительность графического процессора хуже, чем производительность процессора по выводам YOLO

Последнее сообщение Anonymous « 28 июл 2024, 19:48
Добавлено в форуме C#

Anonymous » 28 июл 2024, 19:48 » в форуме C#

Я использую пакет YoloDotNet NuGet для проверки производительности моделей YOLO. Я провожу это тестирование для своей дипломной работы. Однако я столкнулся с проблемой, когда производительность графического процессора значительно хуже, чем...

0 Ответы

54 Просмотры

Последнее сообщение Anonymous
28 июл 2024, 19:48
Как узнать загрузку графического процессора в процентах и температуру графического процессора на видеокартах AMD

Последнее сообщение Гость « 20 сен 2023, 16:48
Добавлено в форуме C++

Гость » 20 сен 2023, 16:48 » в форуме C++

Кто-нибудь знает, как получить загрузку графического процессора (в процентах) и температуру графического процессора на видеокартах Radeon, используя API из какого-либо AMD SDK? Похоже, что в AGS SDK нет необходимого API. Например, у NVIDIA есть...

0 Ответы

224 Просмотры

Последнее сообщение Гость
20 сен 2023, 16:48
У графического процессора закончилась память. Как вызвать сборщик мусора для очистки памяти графического процессора при

Последнее сообщение Гость « 21 сен 2023, 22:54
Добавлено в форуме Python

Гость » 21 сен 2023, 22:54 » в форуме Python

Я обучаю свою модель на удаленном сервере, используя API GridSearchCV для настройки некоторых гиперпараметров, таких как epochs, l_rate, пакетный_размер и терпение. К сожалению, при их настройке после нескольких итераций я получаю следующую ошибку:...

0 Ответы

170 Просмотры

Последнее сообщение Гость
21 сен 2023, 22:54

Вернуться в «C#»