Grounding-dino: что делает load_image внутри и как применить ту же операцию к кадрам из видеоPython

Программы на Python
Ответить
Anonymous
 Grounding-dino: что делает load_image внутри и как применить ту же операцию к кадрам из видео

Сообщение Anonymous »

Проведя некоторое тестирование, я заметил, что выполнение вывода возвращает очень разные результаты для одного и того же изображения, но загруженного разными методами:
Метод 1: официальная функция load_image из библиотеки (она считывает изображение, используя путь, переданный в качестве аргумента)
Метод 2: использование cv2 для чтения изображения, затем преобразование в тензор и затем замена оси, чтобы в качестве первой оси была глубина.
Как я сказал, что оба метода дают вам тензор для передачи в модель, но они возвращают очень разные результаты (метод 2 обычно плохой), я проверил форму изображения, возвращаемого в обоих случаях, и они разные, поэтому внутри определенно происходят преобразования load_image, у меня вопрос: что происходит внутри load_image? поэтому я могу воспроизвести ее в других скриптах.
Моя конечная цель — запустить модель на видео, я имею в виду запуск модели на кадрах видео, поэтому я не могу использовать load_image, потому что они не изображения с диска, они получены из видео, поэтому мне нужно понять, что происходит внутри_загрузки изображения, чтобы я мог эмулировать это поведение на кадрах видео.

Подробнее здесь: https://stackoverflow.com/questions/791 ... he-same-op
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»