Сценарий
Камера наблюдения с фиксированным положением контролирует класс.
Учащиеся сидят на фиксированных позициях столов/сидений.
На интерфейсе я показываю двухмерную компоновку мест (сиденья) значки/сетка).
Целевое поведение
Если место занято, соответствующий значок становится зеленым.
Если место не занято в течение определенного периода времени, оно становится серым (отсутствует).
Важно:
Требование состоит не в том, чтобы определить, кто этот человек, а просто в том, является ли он определенное место занято или нет.
Мой текущий подход:
Не назначайте людям идентификаторы (без ReID / без долгосрочного отслеживания).
Вместо этого определите фиксированную рентабельность инвестиций (область интереса) для каждого места или стола.
Обнаруживайте людей с помощью обнаружения объектов (например, YOLO).
Если обнаруженный человек (например, центральная точка bbox) попадает в ROI места, это место считается занятым.
Что меня больше всего неуверено, так это следующее:
Как надежно сопоставить людей, обнаруженных в 3D-виде с камеры (с перспективой), с 2D-абстрактным расположением сидений во внешнем интерфейсе?
Это похоже на проблему пространственного отображения/назначения, а не просто на обнаружение проблема.
Вопросы
- Достаточно ли использование центральной точки ограничивающей рамки + ROI (точка в многоугольнике) для занятости места в реальных проектах?
- С инженерной точки зрения, что лучше спроектировать систему: ориентированную на сиденье (каждое сиденье сохраняет свое собственное состояние) или ориентированную на человека (отслеживать людей, а затем распределять их по местам)?
- На практике обычно будет достаточно картирования на основе ROI, или для такого типа проблем обычно используется калибровка/гомография камеры?
Подробнее здесь: https://stackoverflow.com/questions/798 ... -seat-occu
Мобильная версия