Как использовать область интереса (ROI) для распознавания текста ML Kit с предварительным просмотром камеры в Android? - Цифровое Кемерово

Как использовать область интереса (ROI) для распознавания текста ML Kit с предварительным просмотром камеры в Android? ⇐ Android

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как использовать область интереса (ROI) для распознавания текста ML Kit с предварительным просмотром камеры в Android?

Цитата

Сообщение Anonymous » 03 окт 2024, 13:09

Я работаю над приложением для Android, используя Jetpack Compose и API распознавания текста ML Kit. Я хочу реализовать область интереса (ROI), чтобы распознавание текста обрабатывало изображения только в этой конкретной области предварительного просмотра камеры. Вот подробности:
Настройка:
Библиотека камер: использование CameraX для предварительного просмотра камеры.
Распознавание текста: использование ML Kit для распознавания текста.
Пользовательский интерфейс. Платформа: Jetpack Compose.
Проблема:
В настоящее время распознавание текста обрабатывает весь предварительный просмотр камеры, но я хочу, чтобы оно фокусировалось на определенной прямоугольной области, определенной рентабельностью инвестиций. Я создал ROI как прямоугольник в своей функции Composable, но не знаю, как обеспечить, чтобы при распознавании текста анализировалась только та часть изображения, которая соответствует этому прямоугольнику.
Фрагмент кода:
Вот соответствующая часть моего кода, в которой я настраиваю TextRecognitionAnalyzer:

Код: Выделить всё

class TextRecognitionAnalyzer(
private val mrzRect: Rect,
private val screenSize: IntSize,
private val onTextDetected: (Text) -> Unit
) : ImageAnalysis.Analyzer {
// Analyzer implementation...
}

В настоящее время я использую следующий подход для определения области обрезки для распознавания текста на основе mrzRect:

Код: Выделить всё

val cropLeft = // calculate crop left based on ROI and scaling
val cropTop = // calculate crop top based on ROI and scaling
val cropRight = // calculate crop right based on ROI and scaling
val cropBottom = // calculate crop bottom based on ROI and scaling

// Use the cropped area for text recognition...

Вопросы:
1. Как точно рассчитать координаты для обрезки изображения на основе рентабельности инвестиций?< /p>
2 – Какие настройки мне необходимо внести, чтобы распознавание текста работало исключительно в пределах определенной рентабельности инвестиций?
3 – Существуют ли какие-либо передовые методы или типичные ошибки, которых следует избегать при работе с рентабельностью инвестиций и предварительным просмотром камеры в этом контексте?
Дополнительная информация:
Я' Я сталкиваюсь с проблемами, когда показания не совсем соответствуют рентабельности инвестиций. Распознавание текста иногда обнаруживает текст за пределами этой области.

Подробнее здесь: https://stackoverflow.com/questions/790 ... amera-prev

Реклама

1727950171

Anonymous

Я работаю над приложением для Android, используя Jetpack Compose и API распознавания текста ML Kit. Я хочу реализовать область интереса (ROI), чтобы распознавание текста обрабатывало изображения только в этой конкретной области предварительного просмотра камеры. Вот подробности:
Настройка:
Библиотека камер: использование CameraX для предварительного просмотра камеры.
Распознавание текста: использование ML Kit для распознавания текста.
Пользовательский интерфейс. Платформа: Jetpack Compose.
Проблема:
В настоящее время распознавание текста обрабатывает весь предварительный просмотр камеры, но я хочу, чтобы оно фокусировалось на определенной прямоугольной области, определенной рентабельностью инвестиций. Я создал ROI как прямоугольник в своей функции Composable, но не знаю, как обеспечить, чтобы при распознавании текста анализировалась только та часть изображения, которая соответствует этому прямоугольнику.
Фрагмент кода:
Вот соответствующая часть моего кода, в которой я настраиваю TextRecognitionAnalyzer:
[code]class TextRecognitionAnalyzer(
private val mrzRect: Rect,
private val screenSize: IntSize,
private val onTextDetected: (Text) -> Unit
) : ImageAnalysis.Analyzer {
// Analyzer implementation...
}
[/code]
В настоящее время я использую следующий подход для определения области обрезки для распознавания текста на основе mrzRect:
[code]val cropLeft = // calculate crop left based on ROI and scaling
val cropTop = // calculate crop top based on ROI and scaling
val cropRight = // calculate crop right based on ROI and scaling
val cropBottom = // calculate crop bottom based on ROI and scaling

// Use the cropped area for text recognition...
[/code]
[b]Вопросы:[/b]
1. Как точно рассчитать координаты для обрезки изображения на основе рентабельности инвестиций?< /p>
2 – Какие настройки мне необходимо внести, чтобы распознавание текста работало исключительно в пределах определенной рентабельности инвестиций?
3 – Существуют ли какие-либо передовые методы или типичные ошибки, которых следует избегать при работе с рентабельностью инвестиций и предварительным просмотром камеры в этом контексте?
[b]Дополнительная информация:[/b]
Я' Я сталкиваюсь с проблемами, когда показания не совсем соответствуют рентабельности инвестиций. Распознавание текста иногда обнаруживает текст за пределами этой области. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79050060/how-to-use-region-of-interest-roi-for-ml-kit-text-recognition-with-camera-prev[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

ROI (область интереса) показывает две линии внутри одной ограничивающей рамки на изображении.

Последнее сообщение Гость « 14 мар 2024, 17:46
Добавлено в форуме Python

Гость » 14 мар 2024, 17:46 » в форуме Python

Я пытаюсь идеально распознать каждую строку с помощью полей ROI на изображении на хинди. Но проблема в том, что две строки с большим жирным текстом находятся внутри одной и той же рентабельности инвестиций. Вы можете увидеть на изображении ниже -...

0 Ответы

28 Просмотры

Последнее сообщение Гость
14 мар 2024, 17:46
ML-Kit Android для обнаружения позы, сопоставление координат ориентиров с предварительным просмотром

Последнее сообщение Anonymous « 17 дек 2024, 06:57
Добавлено в форуме Android

Anonymous » 17 дек 2024, 06:57 » в форуме Android

Я пытаюсь нарисовать точки на ориентирах, используя результаты ML-Kit Pose Detection в приложении Android с помощью Jetpack Compose.
Сначала я рисую точки (красные точки) с помощью чистые координаты, полученные от анализатора. Координаты...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
17 дек 2024, 06:57
PyQtGraph ROI RemoveHandle не удаляет круговой дескриптор для эллиптической ROI

Последнее сообщение Anonymous « 04 авг 2024, 06:54
Добавлено в форуме Python

Anonymous » 04 авг 2024, 06:54 » в форуме Python

Моя цель – запрограммировать рентабельность инвестиций в виде эллипса, который нельзя вращать. Рассмотрим следующий фрагмент кода, модифицированный на основе одного из примеров PyQtGraph:

import numpy as np
import cv2
import pyqtgraph as pg
from...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
04 авг 2024, 06:54
Понимание камеры на Android в фоновом режиме с предварительным просмотром после обработки с OpenCV

Последнее сообщение Anonymous « 29 авг 2025, 18:53
Добавлено в форуме Android

Anonymous » 29 авг 2025, 18:53 » в форуме Android

Моя цель состоит в том, чтобы быть в состоянии активно обрабатывать изображение в фоновом режиме, но когда приложение находится на переднем плане, мне нужен предварительный просмотр, который показывает обработанное изображение, что означает исходный...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
29 авг 2025, 18:53
Понимание камеры на Android в фоновом режиме с предварительным просмотром после обработки с OpenCV

Последнее сообщение Anonymous « 30 авг 2025, 18:54
Добавлено в форуме Android

Anonymous » 30 авг 2025, 18:54 » в форуме Android

Моя цель состоит в том, чтобы быть в состоянии активно обрабатывать изображение в фоновом режиме, но когда приложение находится на переднем плане, мне нужен предварительный просмотр, который показывает обработанное изображение, что означает исходный...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
30 авг 2025, 18:54

Вернуться в «Android»

Programmiererforum