Cv2.warpPerspective означает увеличение времени выполнения в 10 раз при увеличении количества вызовов (утечка памяти?)

Cv2.warpPerspective означает увеличение времени выполнения в 10 раз при увеличении количества вызовов (утечка памяти?) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Cv2.warpPerspective означает увеличение времени выполнения в 10 раз при увеличении количества вызовов (утечка памяти?)

Цитата

Сообщение Anonymous » 30 сен 2024, 07:59

Контекст:
Модели обнаружения и распознавания ансамблей PaddleOCR. Для тестирования используются четыре изображения. Каждое изображение, проходящее через детектор, образует 26–33 ограничивающих прямоугольника (всего 118), которые затем передаются в функцию get_rotate_crop_image (которая вызывает cv2.warpPerspective) для подготовки входных данных для модели распознавания.
Проблема:
После изменения вызывающего кода в рамках поддержки пакетного вывода этот вызов cv2.warpPerspective включается. в среднем на порядок больше времени.
Расследование:
В последовательном случае:

Код: Выделить всё
```
get_rotate_crop_image
```
занимает 0,012678146362304688 секунд или 0,78% от общего времени
среднее время выполнения cv2.warpPerspective составляет 0,00028243048477172853 code> секунд

В случае пакетной обработки:

Код: Выделить всё
```
get_rotate_crop_image
```
занимает 0,4442577362060547 или 23,85% от общего времени
среднее время выполнения cv2.warpPerspective составляет 0,0037425978709075412 > секунд

Подтверждено, что количество вызовов get_rotate_crop_image одинаково в обоих случаях.
С тех пор я внес изменения для запуска get_rotate_crop_image в пуле потоков; это действительно компенсирует ухудшение задержки, но среднее время выполнения cv2.warpPerspective остается в 10 раз больше, чем в последовательном случае, поэтому производительность остается под вопросом.

Код: Выделить всё

def process_image(index_bbox):
index, bbox = index_bbox
image = ori_im[index]

return get_rotate_crop_image(image, bbox)

with ThreadPoolExecutor() as executor:
img_crop_list = list(
executor.map(
process_image,
[
(index, box)
for index, batch in enumerate(dt_boxes)
for box in batch
],
)
)

Гипотеза №1: (опровергнута)
Из-за различий в масштабировании, вызванных предварительной обработкой пакетов изображений, вызов cv2.warpPerspective может работать с изображениями большего размера и, следовательно, использовать больше памяти.
Однако после проверки входного изображения и точек массивы, они похожи; на самом деле изображение меньше в случае пакетного вывода:

Код: Выделить всё

In [1]: import numpy as np
...: from PIL import Image
...: seq_img = Image.open(“sequential/max_time_source.png”)
...: seq_points = np.load(“sequential/max_time_points.npy”)
...: batch_img = Image.open(“batch/max_time_source.png”)
...: batch_points = np.load(“batch/max_time_points.npy”)
...: print(
...:     f”Sequential image shape: {seq_img.size}\n”
...:     f”Batch image shape: {batch_img.size}\n”
...:     f”Sequential points:\n{seq_points}\n”
...:     f”Batch points:\n{batch_points}”
...: )
Sequential image shape: (1130, 842)
Batch image shape: (960, 768)
Sequential points:
[[ 979.  185.]
[1073.  188.]
[1072.  208.]
[ 978.  206.]]
Batch points:
[[832. 159.]
[911. 159.]
[911. 176.]
[832. 176.]]

Чтобы подтвердить, что увеличение времени выполнения не может быть связано с различиями во входных данных функции, get_rotate_crop_image запускался 1000 раз каждый с двумя наборами входных данных и сравнивались времена выполнения - различия незначительны.
Если интересно воспроизвести это, два набора входных данных были загружены на Google Диск.
Гипотеза №2
Память не освобождается после каждого из этих 118 вызовов get_rotate_crop_image/cv2.warpPerspective. Память, выделенная для ~30 вызовов на каждый вызов библиотеки PaddleOCR (последовательный случай), сравнительно меньше, чем память, используемая в пакетном случае. В последнем случае процессор перегружается, вызывая наблюдаемое замедление.
Я не очень разбираюсь в профилировании памяти, но я попробовал Memory_profiler и создал приведенные ниже диаграммы, которые подтверждают увеличение использование памяти в случае пакетной обработки...
Я могу ошибаться, но мне не кажется, что использование памяти ~930 МБ по сравнению с ~700 МБ позволит это большая разница, тем более, что машина, используемая для профилирования, имеет 16 ГБ памяти, а замедление наблюдается и на машинах с гораздо большим объемом памяти (128 ГБ).
Я не знаю, что делать на этом этапе.
Профиль последовательной памяти:

Профиль пакетной памяти:

Подробнее здесь: https://stackoverflow.com/questions/790 ... emory-leak

1727672395

Anonymous

[b]Контекст:[/b]
Модели обнаружения и распознавания ансамблей PaddleOCR. Для тестирования используются четыре изображения. Каждое изображение, проходящее через детектор, образует 26–33 ограничивающих прямоугольника (всего 118), которые затем передаются в функцию get_rotate_crop_image (которая вызывает cv2.warpPerspective) для подготовки входных данных для модели распознавания.
[b]Проблема:[/b]
После изменения вызывающего кода в рамках поддержки пакетного вывода этот вызов cv2.warpPerspective включается. в среднем на порядок больше времени.
[b]Расследование:[/b]
В последовательном случае:
[list]
[*][code]get_rotate_crop_image[/code] занимает 0,012678146362304688 секунд или 0,78% от общего времени
[*]среднее время выполнения cv2.warpPerspective составляет 0,00028243048477172853 code> секунд
[/list]
В случае пакетной обработки:
[list]
[*][code]get_rotate_crop_image[/code] занимает 0,4442577362060547 или 23,85% от общего времени
[*]среднее время выполнения cv2.warpPerspective составляет 0,0037425978709075412 > секунд
[/list]
Подтверждено, что количество вызовов get_rotate_crop_image одинаково в обоих случаях.
С тех пор я внес изменения для запуска get_rotate_crop_image в пуле потоков; это действительно компенсирует ухудшение задержки, но среднее время выполнения cv2.warpPerspective остается в 10 раз больше, чем в последовательном случае, поэтому производительность остается под вопросом.[code]def process_image(index_bbox):
index, bbox = index_bbox
image = ori_im[index]

return get_rotate_crop_image(image, bbox)

with ThreadPoolExecutor() as executor:
img_crop_list = list(
executor.map(
process_image,
[
(index, box)
for index, batch in enumerate(dt_boxes)
for box in batch
],
)
)
[/code]
[b]Гипотеза №1:[/b] (опровергнута)
Из-за различий в масштабировании, вызванных предварительной обработкой пакетов изображений, вызов cv2.warpPerspective может работать с изображениями большего размера и, следовательно, использовать больше памяти.
Однако после проверки входного изображения и точек  массивы, они похожи; на самом деле изображение меньше в случае пакетного вывода:
[code]In [1]: import numpy as np
...: from PIL import Image
...: seq_img = Image.open(“sequential/max_time_source.png”)
...: seq_points = np.load(“sequential/max_time_points.npy”)
...: batch_img = Image.open(“batch/max_time_source.png”)
...: batch_points = np.load(“batch/max_time_points.npy”)
...: print(
...:     f”Sequential image shape: {seq_img.size}\n”
...:     f”Batch image shape: {batch_img.size}\n”
...:     f”Sequential points:\n{seq_points}\n”
...:     f”Batch points:\n{batch_points}”
...: )
Sequential image shape: (1130, 842)
Batch image shape: (960, 768)
Sequential points:
[[ 979.  185.]
[1073.  188.]
[1072.  208.]
[ 978.  206.]]
Batch points:
[[832. 159.]
[911. 159.]
[911. 176.]
[832. 176.]]
[/code]
Чтобы подтвердить, что увеличение времени выполнения не может быть связано с различиями во входных данных функции, get_rotate_crop_image запускался 1000 раз каждый с двумя наборами входных данных и сравнивались времена выполнения - различия незначительны.
Если интересно воспроизвести это, два набора входных данных были загружены на Google Диск.
[b]Гипотеза №2 [/b]
Память не освобождается после каждого из этих 118 вызовов get_rotate_crop_image/cv2.warpPerspective. Память, выделенная для ~30 вызовов на каждый вызов библиотеки PaddleOCR (последовательный случай), сравнительно меньше, чем память, используемая в пакетном случае.  В последнем случае процессор перегружается, вызывая наблюдаемое замедление.
Я не очень разбираюсь в профилировании памяти, но я попробовал Memory_profiler и создал приведенные ниже диаграммы, которые подтверждают увеличение использование памяти в случае пакетной обработки...
Я могу ошибаться, но мне не кажется, что использование памяти ~930 МБ по сравнению с ~700 МБ позволит  это большая разница, тем более, что машина, используемая для профилирования, имеет 16 ГБ памяти, а замедление наблюдается и на машинах с гораздо большим объемом памяти (128 ГБ).
Я не знаю, что делать на этом этапе.
[b]Профиль последовательной памяти:[/b]
[img] [/img]

[b]Профиль пакетной памяти:[/b]
[img]https://i.sstatic.net/1HKNsQ3L.png[/img]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79037436/cv2-warpperspective-mean-runtime-increase-10x-with-more-calls-memory-leak[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

В чем разница между использованием CV2.Imread (PATH) с CVTCOLOR против CV2.Imread (PATH, CV2.imread_GrayScale) в OpenCV?

Последнее сообщение Anonymous « 09 июл 2025, 10:35
Добавлено в форуме Python

Anonymous » 09 июл 2025, 10:35 » в форуме Python

Я наткнулся на два способа преобразования изображения в Greyscale, и я хочу понять разницу между ними:
# Method 1
image = cv2.imread('image.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

и
# Method 2
gray = cv2.imread('image.png',...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
09 июл 2025, 10:35
Память памяти приложения MacOS растет, потребляет большое количество памяти (утечка памяти)?

Последнее сообщение Anonymous « 18 фев 2025, 17:13
Добавлено в форуме Python

Anonymous » 18 фев 2025, 17:13 » в форуме Python

Я только что запустил программу Python в терминале Mac OS, и есть необычная утечка памяти. />

для i в xrange (1000000000, 2000000000, 10):
i2 = i * i
print i, i2, str (i2)
if str (i2) == '1234567890':
break

Когда программа Запуск, он потребляет...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
18 фев 2025, 17:13
Неожиданное увеличение задержки при увеличении числа читателей при реализации многопоточной кольцевой очереди на C++

Последнее сообщение Anonymous « 20 май 2024, 10:47
Добавлено в форуме C++

Anonymous » 20 май 2024, 10:47 » в форуме C++

Я реализовал циклическую очередь, используя массив на C++. Очередь использует две атомарные переменные, переднюю и заднюю, для управления операциями постановки и удаления из очереди. Когда элемент помещается в очередь, задняя часть увеличивается, а...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
20 май 2024, 10:47
Python CV2.Imshow утечка памяти?

Последнее сообщение Anonymous « 18 фев 2025, 18:48
Добавлено в форуме Python

Anonymous » 18 фев 2025, 18:48 » в форуме Python

Используя следующий код Python, увеличивается ли использование оперативной памяти с каждой итерацией цикла?
import cv2, numpy as np

flag = False

while True:
img = np.zeros((2160,3840,3),np.uint8)
if flag:
img = cv2.circle(img,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
18 фев 2025, 18:48
Python CV2.Imshow утечка памяти?

Последнее сообщение Anonymous « 18 фев 2025, 19:48
Добавлено в форуме Python

Anonymous » 18 фев 2025, 19:48 » в форуме Python

Используя следующий код Python, увеличивается ли использование оперативной памяти с каждой итерацией цикла?
import cv2, numpy as np

flag = False

while True:
img = np.zeros((2160,3840,3),np.uint8)
if flag:
img = cv2.circle(img,...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
18 фев 2025, 19:48

Вернуться в «Python»