Цифровые числа в Tesseract OCRAndroid

Форум для тех, кто программирует под Android
Ответить
Anonymous
 Цифровые числа в Tesseract OCR

Сообщение Anonymous »

РЕШЕНИЕ:

Мне пришлось обучать свои собственные данные, чтобы попробовать их с помощью OCR. Кажется, это работает хорошо, но я не знаю, почему обученные данные из arturaugusto не работают для меня =(

https://github.com/adri1992/Tesseract_s ... igital.git

С моими обученными данными, чтобы получить хорошие результаты OCR, я выполнил следующие этапы (Я сделал это с помощью OpenCV):
  • Во-первых, преобразуйте изображение в черно-белое.
  • Во-вторых, примените к изображению размытие по Гауссу.
  • В-третьих, примените к изображению пороговый фильтр.
При этом семь распознаются цифры сегментов.

ВОПРОС:

Я пытаюсь получить распознавание текста через Tesseract на Android и тестирую приложение с этим изображением (с помощью обнаружения текста на семисегментном дисплее с помощью Tesseract OCR):

Изображение


Я использую данные, обработанные arturaugusto (https://github.com/arturaugusto/display_ocr), но неправильный результат оптического распознавания символов:

884288

Ноль распознается как восьмерка, и я не знаю, почему.

Я применяю к изображению размытие по Гауссу и пороговый фильтр через OpenCV, и изображение обрабатывается следующим образом:

Изображение


Есть ли какие-либо другие обработанные данные или вы знаете какой-либо способ решения проблемы?

Подробнее здесь: https://stackoverflow.com/questions/304 ... seract-ocr
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Android»