Android Camera2: доступ CPU/GPU к данным изображения и MediaRecorder/MediaCodec в одном конвейере

Android Camera2: доступ CPU/GPU к данным изображения и MediaRecorder/MediaCodec в одном конвейере ⇐ Android

1 сообщение • Страница 1 из 1

Гость

Android Camera2: доступ CPU/GPU к данным изображения и MediaRecorder/MediaCodec в одном конвейере

Цитата

Сообщение Гость » 22 сен 2023, 15:17

Я занимаюсь сопровождением популярной кроссплатформенной библиотеки мобильных камер, которая может одновременно выполнять предварительный просмотр, захват фотографий, захват видео и обработку кадров. На iOS это работает отлично. Но на Android это практически невозможно сделать с помощью API Camera2/android.media.

Моя структура на высоком уровне:

Важная деталь: VideoPipeline будет выполнять обработку кадров/анализ изображений и запись видео в одном, то есть синхронно.
[*]Мне нужен доступ к буферу CPU/GPU к собственному кадру [*]Мне нужно, чтобы формат кадра можно было настраивать (YUV_420_888, PRIVATE, RGBA_8888) [*]Мне нужно, чтобы он был синхронным (он же сначала запускается MLKit Frame Processor, затем запускается MediaRecorder/MediaCodec; таким образом я могу применять такие вещи, как фильтры лиц, если это необходимо) [*]MediaRecorder/MediaCodec записывает кадр в видеофайл h264/h265 (.mp4).
Кажется, что с Camera2 это вообще невозможно, верно?

Несколько потенциальных решений/идей, которые у меня были:
1. Отдельные выходы
Использовать отдельные выходы камеры, MediaRecorder и ImageReader. Не работает, поскольку камера поддерживает только 3 выхода. У нас уже есть 3 (превью, фото, видео).
2. Используйте ImageReader/ImageWriter, чтобы передать его

Это самое близкое решение, которое у меня было до сих пор, и кажется, что ImageReader/ImageWriter действительно эффективны, поскольку они просто перемещают буферы (по крайней мере, на самом деле). Но у этого подхода есть несколько проблем:
[*]
Это работает не на всех устройствах. Не гарантируется, что MediaRecorder/MediaCodec может быть загружен изображениями из ImageWriter, поэтому иногда он просто вылетает >

[*]
Похоже, что для этого требуется установить флаги графического процессора (только API 29), но даже они в большинстве случаев не работают:

val flags = HardwareBuffer.USAGE_VIDEO_ENCODE или HardwareBuffer.USAGE_GPU_SAMPLED_IMAGE val readFormat = ImageFormat.YUV_420_888 // (может быть YUV, PRIVATE или RGBA_8888) imageReader = ImageReader.newInstance(ширина, высота, ReaderFormat, MAX_IMAGES, флаги) // ... вал mediaRecorder = ... mediaRecorder.prepare() val writeFormat = readFormat // или теперь это должно быть ImageFormat.PRIVATE??? imageWriter = ImageWriter.newInstance(mediaRecorder.surface, MAX_IMAGES, writeFormat) imageReader.setOnImageAvailableListener({читатель -> val image = reader.acquireNextImage() если (isRecording) imageWriter.queueInputImage(изображение) еще изображение.закрыть() }, обработчик) configureCamera(imageReader.surface, ...) // позже: mediaRecorder.start() [*]Насколько я понимаю, для этого требуется дополнительный шаг преобразования из моего формата в любой формат, который хочет MediaRecorder/MediaCodec. Поэтому мне может понадобиться дополнительный ImageReader в формате PRIVATE:

...что просто смешно.
[*]
Он не поддерживает переворот камеры (сзади спереди) во время записи, поскольку ширина/высота буферов изображений может измениться, и это может привести к изменению в этом конвейере нет этапа масштабирования/изменения размера.
3. Создайте собственный конвейер OpenGL
Создаем собственный конвейер OpenGL, в который будет выполняться рендеринг камеры, а затем выполняем сквозной проход рендеринга для рендеринга кадра на все выходные данные:

Но у этого решения есть четыре основных недостатка:
[*]Это действительно очень сложно построить (я уже построил это, см. этот PR, так что это не проблема, если честно) [*]Похоже, что это не так эффективно, как подход ImageReader/ImageWriter, поскольку мы выполняем неявное преобразование RGB и фактический проход рендеринга, тогда как ImageReader /ImageWriter просто перемещает буферы изображений (по крайней мере, насколько я это понимаю) [*]Он работает только в RGBA_8888, так как OpenGL работает в RGB. Это означает, что наш процессор кадров (MLKit) не работает, если он обучен на данных YUV_420_888 — это жесткое требование. [*]Это не синхронно, ImageReader вызывается позже. Мы не могли использовать информацию из фрейма, чтобы решить, что будет отображаться позже (например, чтобы применить фильтр лица).
На данный момент я совершенно ничего не знаю, если честно. Неужели синхронный видеоконвейер вообще невозможен в Android?

Мои требования:
[*]У меня нет проблем с использованием C++/JNI для этого [*]Минимальный уровень API не имеет значения. Если только 33, то это то, что есть.
Я буду признателен за любые подсказки/помощь, возможно, я не знаю некоторых хороших API. Спасибо!

1695385050

Гость


Я занимаюсь сопровождением популярной кроссплатформенной библиотеки мобильных камер, которая может одновременно выполнять предварительный просмотр, захват фотографий, захват видео и обработку кадров. На iOS это работает отлично. Но на Android это практически невозможно сделать с помощью API Camera2/android.media.
 
Моя структура на высоком уровне:
 

[img]https://i.stack.imgur.com/xzgPe.png[/img]

 
Важная деталь: VideoPipeline будет выполнять обработку кадров/анализ изображений [b]и[/b] запись видео [b]в одном[/b], то есть синхронно.
  [*]Мне нужен доступ к буферу CPU/GPU к собственному кадру [*]Мне нужно, чтобы формат кадра можно было настраивать (YUV_420_888, PRIVATE, RGBA_8888) [*]Мне нужно, чтобы он был синхронным (он же сначала запускается MLKit Frame Processor, затем запускается MediaRecorder/MediaCodec; таким образом я могу применять такие вещи, как фильтры лиц, если это необходимо) [*]MediaRecorder/MediaCodec записывает кадр в видеофайл h264/h265 (.mp4).  
Кажется, что с Camera2 это вообще невозможно, верно?
 
Несколько потенциальных решений/идей, которые у меня были:
 1. Отдельные выходы 
Использовать отдельные выходы камеры, MediaRecorder и ImageReader. Не работает, поскольку камера поддерживает только 3 выхода. У нас уже есть 3 (превью, фото, видео).
 2. Используйте ImageReader/ImageWriter, чтобы передать его 

[img]https://i.stack.imgur.com/qhv5G.png[/img]

 
Это самое близкое решение, которое у меня было до сих пор, и кажется, что ImageReader/ImageWriter действительно эффективны, поскольку они просто перемещают буферы (по крайней мере, на самом деле). Но у этого подхода есть несколько проблем:
  [*]
Это работает не на всех устройствах. Не гарантируется, что MediaRecorder/MediaCodec может быть загружен изображениями из ImageWriter, поэтому [b]иногда он просто вылетает[/b] > 🤦‍♂️
  [*]
Похоже, что для этого требуется установить флаги графического процессора (только API 29), но даже они в большинстве случаев не работают:
 
val flags = HardwareBuffer.USAGE_VIDEO_ENCODE или HardwareBuffer.USAGE_GPU_SAMPLED_IMAGE val readFormat = ImageFormat.YUV_420_888 // (может быть YUV, PRIVATE или RGBA_8888) imageReader = ImageReader.newInstance(ширина, высота, ReaderFormat, MAX_IMAGES, флаги) // ... вал mediaRecorder = ... mediaRecorder.prepare() val writeFormat = readFormat // или теперь это должно быть ImageFormat.PRIVATE??? imageWriter = ImageWriter.newInstance(mediaRecorder.surface, MAX_IMAGES, writeFormat) imageReader.setOnImageAvailableListener({читатель ->   val image = reader.acquireNextImage()   если (isRecording)     imageWriter.queueInputImage(изображение)   еще     изображение.закрыть() }, обработчик) configureCamera(imageReader.surface, ...) // позже: mediaRecorder.start()   [*]Насколько я понимаю, для этого требуется дополнительный шаг преобразования из моего формата в любой формат, который хочет MediaRecorder/MediaCodec. Поэтому мне может понадобиться дополнительный ImageReader в формате PRIVATE: 
[img]https://i.stack.imgur.com/8xPYv.png[/img]

 
...что просто смешно.
  [*]
Он не поддерживает переворот камеры (сзади  спереди) во время записи, поскольку ширина/высота буферов изображений может измениться, и это может привести к изменению в этом конвейере нет этапа масштабирования/изменения размера.
   3. Создайте собственный конвейер OpenGL 
Создаем собственный конвейер OpenGL, в который будет выполняться рендеринг камеры, а затем выполняем сквозной проход рендеринга для рендеринга кадра на все выходные данные:
 

[img]https://i.stack.imgur.com/fNGby.png[/img]

 
Но у этого решения есть четыре основных недостатка:
  [*]Это действительно очень сложно построить (я уже построил это, см. этот PR, так что это не проблема, если честно) [*]Похоже, что это не так эффективно, как подход ImageReader/ImageWriter, поскольку мы выполняем неявное преобразование RGB и фактический проход рендеринга, тогда как ImageReader /ImageWriter просто перемещает буферы изображений (по крайней мере, насколько я это понимаю) [*]Он работает только в RGBA_8888, так как OpenGL работает в RGB. Это означает, что наш процессор кадров (MLKit) не работает, если он обучен на данных YUV_420_888 — это жесткое требование. [*]Это не синхронно, ImageReader вызывается позже. Мы не могли использовать информацию из фрейма, чтобы решить, что будет отображаться позже (например, чтобы применить фильтр лица).   
На данный момент я совершенно ничего не знаю, если честно. Неужели синхронный видеоконвейер вообще невозможен в Android?
 
Мои требования:
  [*]У меня нет проблем с использованием C++/JNI для этого [*]Минимальный уровень API не имеет значения. Если только 33, то это то, что есть.  
Я буду признателен за любые подсказки/помощь, возможно, я не знаю некоторых хороших API. Спасибо!

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Вопрос о синхронизации CPU/GPU DirectX12

Последнее сообщение Anonymous « 10 июл 2024, 07:33
Добавлено в форуме C++

Anonymous » 10 июл 2024, 07:33 » в форуме C++

Я пытаюсь понять синхронизацию CPU/GPU в DirectX 12, но кое-что меня смущает. Вот пример кода из примера HelloFrameBuffering от Microsoft:
// Prepare to render the next frame.
void D3D12HelloFrameBuffering::MoveToNextFrame()
{
// Schedule a Signal...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
10 июл 2024, 07:33
GPU в GPU прямой передачу данных с помощью ConnectX и RDMA

Последнее сообщение Anonymous « 16 май 2025, 22:23
Добавлено в форуме Python

Anonymous » 16 май 2025, 22:23 » в форуме Python

Мы пытаемся подключить два графических процессора, расположенных на двух серверах через RDMA и Infinibands. Графильные процессоры-NVIDIA RTX 6000 ADA, а Infinbands-NVIDIA CONNECTX-6.
Конфигурация сервера
Наш сервер имеет конфигурацию изображения,...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
16 май 2025, 22:23
Невозможно установить временную метку для объекта изображения Android MediaCodec из собственного кода C++.

Последнее сообщение Anonymous « 16 сен 2024, 07:43
Добавлено в форуме Android

Anonymous » 16 сен 2024, 07:43 » в форуме Android

Я создал очередь для хранения изображений из ImageReader в cpp.
при копировании элементов очереди в объект изображения из метода MediaCodec.getInputImage(index) я столкнулся с проблемой, когда байтовые буферы успешно обрабатываются. скопировано, но...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 07:43
Невозможно установить временную метку для объекта изображения Android MediaCodec из собственного кода C++.

Последнее сообщение Anonymous « 16 сен 2024, 07:43
Добавлено в форуме C++

Anonymous » 16 сен 2024, 07:43 » в форуме C++

Я создал очередь для хранения изображений из ImageReader в cpp.
при копировании элементов очереди в объект изображения из метода MediaCodec.getInputImage(index) я столкнулся с проблемой, когда байтовые буферы успешно обрабатываются. скопировано, но...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 07:43
Ожидалось, что все тензоры будут находиться на одном устройстве, но обнаружено как минимум два устройства: cpu и cuda:0,

Последнее сообщение Anonymous « 25 сен 2024, 00:47
Добавлено в форуме Python

Anonymous » 25 сен 2024, 00:47 » в форуме Python

Я работаю над моделью, предназначенной для работы исключительно на графическом процессоре или на центральном процессоре, но поскольку я работаю над кластером HPC, я использую оба варианта.
Я' Я пытался преобразовать код для работы в моей настройке,...

0 Ответы

41 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 00:47

Вернуться в «Android»