Система должна поддерживать следующие методы ввода:
- Загрузка локального видеофайла
- Прямая трансляция с веб-камеры
- URL-адрес камеры
- URL-адрес видео YouTube
- Выбор точки/ROI OpenCV (точки щелчка мыши на кадре)
- Обнаружение зон (обнаружение только транспортных средств) внутри выбранных полигонов/зон)
- Модульная архитектура, поэтому каждый метод ввода использует один и тот же конвейер обработки.
Вопросы:
- Как лучше всего структурировать общий конвейер ввода видео для:
- путь к файлу
- Веб-камера
- URL-адрес RTSP
- URL-адрес YouTube (через pytube или yt-dlp)?
- Как правильно реализовать выбор точки OpenCV (щелчки мыши) в первом кадре и передать эти координаты зоны в мой цикл обнаружения?
- Существуют ли стандартные шаблоны для объединения выбора ROI + обнаружения + покадровой обработки в системах реального времени?
- Любой пример архитектуры или шаблона кода, который четко разделяет:
- обработчик ввода
- обработка/обнаружение (YOLO/OpenCV)
- вывод/журналирование
Подробнее здесь: https://stackoverflow.com/questions/798 ... amera-rtsp
Мобильная версия