Как использовать область интереса (ROI) для распознавания текста ML Kit с предварительным просмотром камеры в Android?Android

Форум для тех, кто программирует под Android
Ответить Пред. темаСлед. тема
Anonymous
 Как использовать область интереса (ROI) для распознавания текста ML Kit с предварительным просмотром камеры в Android?

Сообщение Anonymous »

Я работаю над приложением для Android, используя Jetpack Compose и API распознавания текста ML Kit. Я хочу реализовать область интереса (ROI), чтобы распознавание текста обрабатывало изображения только в этой конкретной области предварительного просмотра камеры. Вот подробности:
Настройка:
Библиотека камер: использование CameraX для предварительного просмотра камеры.
Распознавание текста: использование ML Kit для распознавания текста.
Пользовательский интерфейс. Платформа: Jetpack Compose.
Проблема:
В настоящее время распознавание текста обрабатывает весь предварительный просмотр камеры, но я хочу, чтобы оно фокусировалось на определенной прямоугольной области, определенной рентабельностью инвестиций. Я создал ROI как прямоугольник в своей функции Composable, но не знаю, как обеспечить, чтобы при распознавании текста анализировалась только та часть изображения, которая соответствует этому прямоугольнику.
Фрагмент кода:
Вот соответствующая часть моего кода, в которой я настраиваю TextRecognitionAnalyzer:

Код: Выделить всё

class TextRecognitionAnalyzer(
private val mrzRect: Rect,
private val screenSize: IntSize,
private val onTextDetected: (Text) -> Unit
) : ImageAnalysis.Analyzer {
// Analyzer implementation...
}
В настоящее время я использую следующий подход для определения области обрезки для распознавания текста на основе mrzRect:

Код: Выделить всё

val cropLeft = // calculate crop left based on ROI and scaling
val cropTop = // calculate crop top based on ROI and scaling
val cropRight = // calculate crop right based on ROI and scaling
val cropBottom = // calculate crop bottom based on ROI and scaling

// Use the cropped area for text recognition...
Вопросы:
1. Как точно рассчитать координаты для обрезки изображения на основе рентабельности инвестиций?< /p>
2 – Какие настройки мне необходимо внести, чтобы распознавание текста работало исключительно в пределах определенной рентабельности инвестиций?
3 – Существуют ли какие-либо передовые методы или типичные ошибки, которых следует избегать при работе с рентабельностью инвестиций и предварительным просмотром камеры в этом контексте?
Дополнительная информация:
Я' Я сталкиваюсь с проблемами, когда показания не совсем соответствуют рентабельности инвестиций. Распознавание текста иногда обнаруживает текст за пределами этой области.

Подробнее здесь: https://stackoverflow.com/questions/790 ... amera-prev
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Android»