Как точно расположить 3D-ограничивающие рамки в Unity для HoloLens 2 на основе результатов обнаружения 2D-объектов? - Цифровое Кемерово

Как точно расположить 3D-ограничивающие рамки в Unity для HoloLens 2 на основе результатов обнаружения 2D-объектов? ⇐ C#

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как точно расположить 3D-ограничивающие рамки в Unity для HoloLens 2 на основе результатов обнаружения 2D-объектов?

Цитата

Сообщение Anonymous » 26 июн 2024, 18:07

I am developing an application for HoloLens 2 using Unity 2022.3.30f1 and MRTK Foundation 2.8.3. My goal is to position 3D bounding boxes in the real world based on 2D object detection results obtained from a YOLOv9 server.
Problem:

Несмотря на несколько попыток, ограничивающие рамки либо расположены неточно, либо перекрывают друг друга, если обнаружено несколько объектов. Размеры ограничивающих рамок также неверны.
Код для отображения 2D-координат с сервера yolov9 в 3D-мировое пространство в единстве:
private void CreateBoundingBox(обнаружение обнаружения)
{
Matrix4x4 проекцияMatrix = Camera.main.projectionMatrix;
Matrix4x4 cameraMatrix = Camera.main.worldToCameraMatrix;
Matrix4x4 vpMatrix = projectionMatrix * cameraMatrix;
Matrix4x4 vpMatrixInverse = vpMatrix.inverse;
Vector3 bottomLeftViewport = new Vector3(detection.x1 / inputImage.width, detection.y1 / inputImage.height, 0.5f);
Vector3 topRightViewport = new Vector3(detection.x2 / inputImage.width, detection.y2 / inputImage.height, 0.5f);

Vector3 bottomLeftWorld = GetWorldCoordinatesFromViewport(bottomLeftViewport, vpMatrixInverse);
Vector3 topRightWorld = GetWorldCoordinatesFromViewport(topRightViewport, vpMatrixInverse);

Vector3 centerWorld = (bottomLeftWorld + topRightWorld) / 2;
Vector3 sizeWorld = topRightWorld - bottomLeftWorld;

detectionResultsText.text += $"bottom-left viewport: {bottomLeftViewport}\n";
detectionResultsText.text += $"top-right viewport: {topRightViewport}\n";
detectionResultsText.text += $"bottom-left world: {bottomLeftWorld}\n";
detectionResultsText.text += $"top-right world: {topRightWorld}\n";
detectionResultsText.text += $"center world: {centerWorld}\n";
detectionResultsText.text += $"size world: {sizeWorld}\n";

BoundingBoxHolder boundingBoxHolder = Instantiate(boundingBoxHolderPrefab, centerWorld, Quaternion.identity);
boundingBoxHolder.SetBoundingBoxSize(sizeWorld);
boundingBoxHolder.SetClassText(detection.@class);
boundingBoxHolder.transform.LookAt(Camera.main.transform);

boundingBoxHolders.Add(boundingBoxHolder);
}

Information
Image Dimensions:

Captured Image Dimensions: 2272 x 1278
Processed Image Dimensions by YOLOv9 server: 2272 x 1278
Camera Specifications:

FOV: 60 degrees
Near Plane: 0.1
Far Plane: 1000
Example JSON from YOLOv9 Server: Multiple objects that are detected
`{
"objects": [
{"class": "chair", "confidence": 0.8503433465957642, "x1": 40.0, "y1": 12.0, "x2": 184.0, "y2": 132.0},
{"class": "bottle", "confidence": 0.811337411403656, "x1": 80.0, "y1": 74.0, "x2": 117.0, "y2": 150.0},
{"class": "backpack", "confidence": 0.7879111766815186, "x1": 269.0, "y1": 137.0, "x2": 353.0, "y2": 245.0},
{"class": "bottle", "confidence": 0.4553461968898773, "x1": 70.0, "y1": 98.0, "x2": 102.0, "y2": 162.0},
{"class": "keyboard", "confidence": 0.35976797342300415, "x1": 9.0, "y1": 211.0, "x2": 105.0, "y2": 272.0}
]
}`
Issue:

Bounding boxes overlap each other.
Bounding boxes are inaccurately positioned.
Bounding box sizes are too small

How can I ensure that the detected objects' bounding boxes are accurately positioned in the real world?

Подробнее здесь: https://stackoverflow.com/questions/786 ... ased-on-2d

Реклама

1719414428

Anonymous

I am developing an application for HoloLens 2 using Unity 2022.3.30f1 and MRTK Foundation 2.8.3. My goal is to position 3D bounding boxes in the real world based on 2D object detection results obtained from a YOLOv9 server.
Problem:

Несмотря на несколько попыток, ограничивающие рамки либо расположены неточно, либо перекрывают друг друга, если обнаружено несколько объектов. Размеры ограничивающих рамок также неверны.
Код для отображения 2D-координат с сервера yolov9 в 3D-мировое пространство в единстве:
private void CreateBoundingBox(обнаружение обнаружения)
{
Matrix4x4 проекцияMatrix = Camera.main.projectionMatrix;
Matrix4x4 cameraMatrix = Camera.main.worldToCameraMatrix;
Matrix4x4 vpMatrix = projectionMatrix * cameraMatrix;
Matrix4x4 vpMatrixInverse = vpMatrix.inverse; 
Vector3 bottomLeftViewport = new Vector3(detection.x1 / inputImage.width, detection.y1 / inputImage.height, 0.5f);
Vector3 topRightViewport = new Vector3(detection.x2 / inputImage.width, detection.y2 / inputImage.height, 0.5f);

Vector3 bottomLeftWorld = GetWorldCoordinatesFromViewport(bottomLeftViewport, vpMatrixInverse);
Vector3 topRightWorld = GetWorldCoordinatesFromViewport(topRightViewport, vpMatrixInverse);

Vector3 centerWorld = (bottomLeftWorld + topRightWorld) / 2;
Vector3 sizeWorld = topRightWorld - bottomLeftWorld;

detectionResultsText.text += $"bottom-left viewport: {bottomLeftViewport}\n";
detectionResultsText.text += $"top-right viewport: {topRightViewport}\n";
detectionResultsText.text += $"bottom-left world: {bottomLeftWorld}\n";
detectionResultsText.text += $"top-right world: {topRightWorld}\n";
detectionResultsText.text += $"center world: {centerWorld}\n";
detectionResultsText.text += $"size world: {sizeWorld}\n";

BoundingBoxHolder boundingBoxHolder = Instantiate(boundingBoxHolderPrefab, centerWorld, Quaternion.identity);
boundingBoxHolder.SetBoundingBoxSize(sizeWorld);
boundingBoxHolder.SetClassText(detection.@class);
boundingBoxHolder.transform.LookAt(Camera.main.transform);

boundingBoxHolders.Add(boundingBoxHolder);
}

Information
Image Dimensions:

Captured Image Dimensions: 2272 x 1278
Processed Image Dimensions by YOLOv9 server: 2272 x 1278
Camera Specifications:

FOV: 60 degrees
Near Plane: 0.1
Far Plane: 1000
Example JSON from YOLOv9 Server: Multiple objects that are detected
`{
"objects": [
{"class": "chair", "confidence": 0.8503433465957642, "x1": 40.0, "y1": 12.0, "x2":    184.0, "y2": 132.0},
{"class": "bottle", "confidence": 0.811337411403656, "x1": 80.0, "y1": 74.0, "x2": 117.0, "y2": 150.0},
{"class": "backpack", "confidence": 0.7879111766815186, "x1": 269.0, "y1": 137.0, "x2": 353.0, "y2": 245.0},
{"class": "bottle", "confidence": 0.4553461968898773, "x1": 70.0, "y1": 98.0, "x2": 102.0, "y2": 162.0},
{"class": "keyboard", "confidence": 0.35976797342300415, "x1": 9.0, "y1": 211.0, "x2": 105.0, "y2": 272.0}
]
}`
Issue:

Bounding boxes overlap each other.
Bounding boxes are inaccurately positioned.
Bounding box sizes are too small

How can I ensure that the detected objects' bounding boxes are accurately positioned in the real world?
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78673249/how-to-accurately-position-3d-bounding-boxes-in-unity-for-hololens-2-based-on-2d[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pytorch быстрее r-cnn, нет ошибки возвращаемого значения изображения ограничивающей рамки (все ограничивающие рамки долж

Последнее сообщение Anonymous « 30 июл 2024, 02:08
Добавлено в форуме Python

Anonymous » 30 июл 2024, 02:08 » в форуме Python

Я пытаюсь обучить Faster R-CNN на пользовательском наборе данных.
Когда я тренируюсь без изображения объекта (изображение без ограничивающих рамок), он возвращает ошибку значения: «Все ограничивающие рамки должны иметь положительную высоту и ширину»...

0 Ответы

63 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 02:08
Android Studio: пользовательская модель с набором ML, возвращающая неправильные ограничивающие рамки, несовпадения с пре

Последнее сообщение Гость « 17 мар 2024, 12:32
Добавлено в форуме JAVA

Гость » 17 мар 2024, 12:32 » в форуме JAVA

Я работаю над проектом Android Studio, в котором использую пользовательскую модель, завернутую в Google ML Kit, для обнаружения объектов в режиме реального времени. Однако я столкнулся с проблемой, из-за которой ограничивающие рамки, возвращаемые...

0 Ответы

25 Просмотры

Последнее сообщение Гость
17 мар 2024, 12:32
Android Studio: пользовательская модель с набором ML, возвращающая неправильные ограничивающие рамки, несовпадения с пре

Последнее сообщение Гость « 17 мар 2024, 12:32
Добавлено в форуме Android

Гость » 17 мар 2024, 12:32 » в форуме Android

Я работаю над проектом Android Studio, в котором использую пользовательскую модель, завернутую в Google ML Kit, для обнаружения объектов в режиме реального времени. Однако я столкнулся с проблемой, из-за которой ограничивающие рамки, возвращаемые...

0 Ответы

26 Просмотры

Последнее сообщение Гость
17 мар 2024, 12:32
Как преобразовать X AnyLabeling JSON в ограничивающие рамки, ориентированные на YOLOv8

Последнее сообщение Anonymous « 29 апр 2024, 05:12
Добавлено в форуме Python

Anonymous » 29 апр 2024, 05:12 » в форуме Python

В настоящее время я работаю над проектом, который включает преобразование файлов JSON, экспортированных из X AnyLabeling. Эти файлы содержат аннотации для повернутых ограничивающих рамок (0.json-11.json), и мне нужно преобразовать их в формат набора...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
29 апр 2024, 05:12
Проверьте, перекрываются ли две ограничивающие рамки

Последнее сообщение Anonymous « 02 июн 2024, 22:27
Добавлено в форуме C#

Anonymous » 02 июн 2024, 22:27 » в форуме C#

Я сделал что-то вроде этого:
Pseudo:
`Function checkOverlap(thisRectangle, otherRectangle):
if thisRectangle.UpperRight.Longitude otherRectangle.UpperRight.Longitude
return false
if thisRectangle.UpperRight.Latitude...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
02 июн 2024, 22:27

Вернуться в «C#»

Programmiererforum