Как реализовать распознавание транспортных средств в реальном времени с выбором файла, URL-адресом камеры/RTSP, вводом U

Как реализовать распознавание транспортных средств в реальном времени с выбором файла, URL-адресом камеры/RTSP, вводом U ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как реализовать распознавание транспортных средств в реальном времени с выбором файла, URL-адресом камеры/RTSP, вводом U

Цитата

Сообщение Anonymous » 14 ноя 2025, 08:48

Я создаю систему распознавания транспортных средств в реальном времени с использованием Python.

Система должна поддерживать следующие методы ввода:

Загрузка локального видеофайла
Прямая трансляция с веб-камеры
URL-адрес камеры
URL-адрес видео YouTube

Кроме того, я хочу реализовать:

Выбор точки/ROI OpenCV (точки щелчка мыши на кадре)
Обнаружение зон (обнаружение только транспортных средств) внутри выбранных полигонов/зон)
Модульная архитектура, поэтому каждый метод ввода использует один и тот же конвейер обработки.

Я могу загружать видео по отдельности, но изо всех сил пытаюсь создать чистую структуру, которая последовательно обрабатывает все типы ввода. Мне также нужно руководство по интеграции OpenCV cv2.setMouseCallback() для выбора рентабельности инвестиций перед запуском цикла обнаружения.
Вопросы:

Как лучше всего структурировать общий конвейер ввода видео для:
- путь к файлу
- Веб-камера
- URL-адрес RTSP
- URL-адрес YouTube (через pytube или yt-dlp)?
Как правильно реализовать выбор точки OpenCV (щелчки мыши) в первом кадре и передать эти координаты зоны в мой цикл обнаружения?
Существуют ли стандартные шаблоны для объединения выбора ROI + обнаружения + покадровой обработки в системах реального времени?
Любой пример архитектуры или шаблона кода, который четко разделяет:
- обработчик ввода
- обработка/обнаружение (YOLO/OpenCV)
- вывод/журналирование

Подробнее здесь: https://stackoverflow.com/questions/798 ... amera-rtsp

1763099307

Anonymous

Я создаю систему распознавания транспортных средств в реальном времени с использованием Python.

Система должна поддерживать следующие методы ввода:
[list]
[*][b]Загрузка локального видеофайла[/b]

[*][b]Прямая трансляция с веб-камеры[/b]

[*][b]URL-адрес камеры[/b]

[*][b]URL-адрес видео YouTube[/b]

[/list]
Кроме того, я хочу реализовать:
[list]
[*][b]Выбор точки/ROI OpenCV[/b] (точки щелчка мыши на кадре)

[*][b]Обнаружение зон[/b] (обнаружение только транспортных средств) внутри выбранных полигонов/зон)

[*]Модульная архитектура, поэтому каждый метод ввода использует один и тот же конвейер обработки.

[/list]
Я могу загружать видео по отдельности, но изо всех сил пытаюсь создать чистую структуру, которая последовательно обрабатывает все типы ввода. Мне также нужно руководство по интеграции OpenCV cv2.setMouseCallback() для выбора рентабельности инвестиций перед запуском цикла обнаружения.
[b]Вопросы:[/b]
[list]
[*]Как лучше всего структурировать общий конвейер ввода видео для:
[list]
путь к файлу

[*]Веб-камера

[*]URL-адрес RTSP

[*]URL-адрес YouTube (через pytube или yt-dlp)?

[/list]

[*]Как правильно реализовать выбор точки OpenCV (щелчки мыши) в первом кадре и передать эти координаты зоны в мой цикл обнаружения?

[*]Существуют ли стандартные шаблоны для объединения выбора ROI + обнаружения + покадровой обработки в системах реального времени?

[*]Любой пример архитектуры или шаблона кода, который четко разделяет:
[list]
обработчик ввода

[*]обработка/обнаружение (YOLO/OpenCV)

[*]вывод/журналирование

[/list]

[/list] 

Подробнее здесь: [url]https://stackoverflow.com/questions/79819682/how-to-implement-real-time-vehicle-recognition-with-file-selection-camera-rtsp[/url]