Преобразование мира в пиксели в Pyrender

Преобразование мира в пиксели в Pyrender ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Преобразование мира в пиксели в Pyrender

Цитата

Сообщение Anonymous » 13 дек 2024, 22:14

Я пытаюсь преобразовать точку в трехмерном мире, визуализированном с помощью Pyrender, в пиксельные координаты. Преобразование мира в кадр камеры, кажется, работает, однако преобразование кадра камеры в пиксельный кадр неверно, и я не могу понять, что я делаю неправильно. Я ценю любые подсказки!
Цель состоит в том, чтобы получить пиксельные координаты uvw мировой точки UVW. В настоящее время я делаю следующее:
Создаю камеру:
Я создаю камеру из уже существующей внутренней матрицы (= K). Я делаю это в основном в целях отладки, чтобы быть уверенным, что K прав:

Код: Выделить всё

K = np.array([[415.69219382,   0.        , 320.        ],
[  0.        , 415.69219382, 240.        ],
[  0.        ,   0.        ,   1.        ]])
K = np.ascontiguousarray(K, dtype=np.float32)
p_cam = pyrender.camera.IntrinsicsCamera(fx = K[0][0], fy = [1][1], cx =[0][2],  cy = [1][2])

scene.add(p_cam, pose=cam_pose.get_transformation_matrix(x=6170., y=4210., z=60., yaw=20, pitch=0, roll=40)) # cam_pose is my own class

Создать матрицу преобразования
Я создаю матрицу преобразования с внешним поворотом.

Код: Выделить всё

def get_transformation_matrix(self, x, y, z, yaw, pitch, roll):
from scipy.spatial.transform import Rotation as R
'''
yaw = rotate around z axis
pitch = rotate around y axis
roll = rotate around x axis
'''
xyz = np.array([
[x],
[y],
[z]
])
rot = rot_matrix = R.from_euler('zyx', [yaw, pitch, roll], degrees=True).as_matrix()
last_row = np.array([[0,0,0,1]])
tf_m = np.concatenate((np.concatenate((rot,xyz), axis = 1), last_row), axis = 0)
return np.ascontiguousarray(tf_m, dtype=np.float32)

Рендеринг изображения
Используя созданную камеру, я визуализирую следующее изображение. Точка, которую я пытаюсь трансформировать, — это кончик крыши, координаты которого приблизительно равны 500 160. Я отметил его в 3D-сцене розовым цилиндром.

Преобразование мира в пиксельный кадр

Код: Выделить всё

from icecream import ic
K = np.concatenate((K, [[0],[0],[0]]), axis = 1)
UVW1 = [[6184],[4245],[38],[1]] #the homogeneous coordinates of the pink cylinder in the world frame
world_to_camera = np.linalg.inv(cam_pose.transformation_matrix).astype('float32') @ UVW1
ic(world_to_camera)
camera_to_pixel = K @ world_to_camera
ic(camera_to_pixel/camera_to_pixel[2]) #Transforming the homogeneous coordinates back

Выход:

Код: Выделить всё

ic| world_to_camera: array([[ 17.48892188],
[  7.11796755],
[-39.35071968],
[  1.        ]])

ic| camera_to_pixel/camera_to_pixel[2]: array([[135.25094424],
[164.80738424],
[  1.        ]])

Результаты
Мне кажется, что поза world_to_camera может быть правильной (я могу ошибаться). Однако при преобразовании из кадра камеры в пиксельный кадр координата X (135) неверна (координата Y (164) все еще может иметь смысл).
Прикреплен скриншот 3D сцена. Желтый цилиндр+оси представляют камеру, а синяя точка представляет точку, которую я пытаюсь преобразовать (ранее — розовая на визуализированном изображении).

Поэтому для меня единственным источником ошибки может быть внутренняя матрица, однако я определяю сам эту матрицу, поэтому не понимаю, как она может быть неправильной. Есть ли что-то, на что я не обращаю внимания?

Подробнее здесь: https://stackoverflow.com/questions/768 ... n-pyrender

1734117297

Anonymous

Я пытаюсь преобразовать точку в трехмерном мире, визуализированном с помощью Pyrender, в пиксельные координаты. Преобразование мира в кадр камеры, кажется, работает, однако преобразование кадра камеры в пиксельный кадр неверно, и я не могу понять, что я делаю неправильно. Я ценю любые подсказки!
Цель состоит в том, чтобы получить пиксельные координаты uvw мировой точки UVW. В настоящее время я делаю следующее:
Создаю камеру:
Я создаю камеру из уже существующей внутренней матрицы (= K). Я делаю это в основном в целях отладки, чтобы быть уверенным, что K прав:
[code]K = np.array([[415.69219382,   0.        , 320.        ],
[  0.        , 415.69219382, 240.        ],
[  0.        ,   0.        ,   1.        ]])
K = np.ascontiguousarray(K, dtype=np.float32)
p_cam = pyrender.camera.IntrinsicsCamera(fx = K[0][0], fy = [1][1], cx =[0][2],  cy = [1][2])

scene.add(p_cam, pose=cam_pose.get_transformation_matrix(x=6170., y=4210., z=60., yaw=20, pitch=0, roll=40)) # cam_pose is my own class
[/code]
Создать матрицу преобразования
Я создаю матрицу преобразования с внешним поворотом.
[code]def get_transformation_matrix(self, x, y, z, yaw, pitch, roll):
from scipy.spatial.transform import Rotation as R
'''
yaw = rotate around z axis
pitch = rotate around y axis
roll = rotate around x axis
'''
xyz = np.array([
[x],
[y],
[z]
])
rot = rot_matrix = R.from_euler('zyx', [yaw, pitch, roll], degrees=True).as_matrix()
last_row = np.array([[0,0,0,1]])
tf_m = np.concatenate((np.concatenate((rot,xyz), axis = 1), last_row), axis = 0)
return np.ascontiguousarray(tf_m, dtype=np.float32)
[/code]
Рендеринг изображения
Используя созданную камеру, я визуализирую следующее изображение. Точка, которую я пытаюсь трансформировать, — это кончик крыши, координаты которого приблизительно равны 500 160. Я отметил его в 3D-сцене розовым цилиндром.
[img]https://i.sstatic.net/0s7Bf.png[/img]
 
Преобразование мира в пиксельный кадр
[code]from icecream import ic
K = np.concatenate((K, [[0],[0],[0]]), axis = 1)
UVW1 = [[6184],[4245],[38],[1]] #the homogeneous coordinates of the pink cylinder in the world frame
world_to_camera = np.linalg.inv(cam_pose.transformation_matrix).astype('float32') @ UVW1
ic(world_to_camera)
camera_to_pixel = K @ world_to_camera
ic(camera_to_pixel/camera_to_pixel[2]) #Transforming the homogeneous coordinates back
[/code]
[b]Выход:[/b]
[code]ic| world_to_camera: array([[ 17.48892188],
[  7.11796755],
[-39.35071968],
[  1.        ]])

ic| camera_to_pixel/camera_to_pixel[2]: array([[135.25094424],
[164.80738424],
[  1.        ]])
[/code]
Результаты
Мне кажется, что поза world_to_camera может быть правильной (я могу ошибаться). Однако при преобразовании из кадра камеры в пиксельный кадр координата X (135) неверна (координата Y (164) все еще может иметь смысл).
Прикреплен скриншот 3D сцена. Желтый цилиндр+оси представляют камеру, а синяя точка представляет точку, которую я пытаюсь преобразовать (ранее — розовая на визуализированном изображении).
[img]https://i.sstatic.net/JHeat.jpg[/img]

Поэтому для меня единственным источником ошибки может быть внутренняя матрица, однако я определяю сам эту матрицу, поэтому не понимаю, как она может быть неправильной. Есть ли что-то, на что я не обращаю внимания? 

Подробнее здесь: [url]https://stackoverflow.com/questions/76849780/world-to-pixel-transformation-in-pyrender[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Преобразование мира в пиксели в Pyrender

Последнее сообщение Anonymous « 13 дек 2024, 06:11
Добавлено в форуме Python

Anonymous » 13 дек 2024, 06:11 » в форуме Python

Я пытаюсь преобразовать точку в трехмерном мире, визуализированном с помощью Pyrender, в пиксельные координаты. Преобразование мира в кадр камеры, кажется, работает, однако преобразование кадра камеры в пиксельный кадр неверно, и я не могу понять,...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
13 дек 2024, 06:11
Установите все пиксели красными (255,0,0) с помощью Texture2D.SetPixelData, но пиксели изменятся на многоцветный набор.

Последнее сообщение Гость « 22 сен 2023, 18:32
Добавлено в форуме C#

Гость » 22 сен 2023, 18:32 » в форуме C#

У меня есть следующий код:

с использованием System.Collections; использование System.Collections.Generic; использование UnityEngine; использование UnityEngine.UI; общедоступный класс TextScript: MonoBehaviour { Текстура Текстура2D; // Start...

0 Ответы

60 Просмотры

Последнее сообщение Гость
22 сен 2023, 18:32
Есть ли способ узнать, какие пиксели на экране находятся в тени, а какие пиксели не находятся внутри сценария Unity C#?

Последнее сообщение Anonymous « 27 янв 2025, 15:16
Добавлено в форуме C#

Anonymous » 27 янв 2025, 15:16 » в форуме C#

Я разрабатываю приложение ARFoundation для мобильных устройств Android с использованием игрового движка Unity.
Я хочу визуализировать тень виртуального объекта AR, помещенного в плоскость AR, в которой он расположен. Затем я хочу получить доступ к...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 15:16
Почему моя проекция 3D-объекта не совпадает в Pyrender с внутренними функциями и позой ARKit?

Последнее сообщение Anonymous « 29 дек 2024, 12:20
Добавлено в форуме Python

Anonymous » 29 дек 2024, 12:20 » в форуме Python

Я работаю с репозиторием неявной глубины от Niantic Labs, но столкнулся с проблемой. В репозитории нет общего кода для проецирования 3D-точек или значений глубины на плоскость изображения 2D-камеры.
Я пытаюсь спроецировать 3D-объект в сцену,...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
29 дек 2024, 12:20
Почему прогнозируемые клавиатуры слегка отклоняются от наземной истины в моделировании камеры Pyrender?

Последнее сообщение Anonymous « 12 мар 2025, 15:31
Добавлено в форуме Python

Anonymous » 12 мар 2025, 15:31 » в форуме Python

Чтобы проверить библиотеку калибровки камеры, я написал сценарий Python с помощью Pyrender, где я установил камеру для обмоток для захвата платы круга сетки. Код доступен по адресу: Позиции в файле JSON.
Скрипт моделирования:
import os
import...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
12 мар 2025, 15:31

Вернуться в «Python»