Цифровые числа в Tesseract OCRAndroid

Форум для тех, кто программирует под Android
Ответить
Anonymous
 Цифровые числа в Tesseract OCR

Сообщение Anonymous »

РЕШЕНИЕ:

Мне пришлось обучать свои собственные данные, чтобы попробовать их с помощью OCR. Кажется, это работает хорошо, но я не знаю, почему обученные данные из arturaugusto не работают для меня =(

https://github.com/adri1992/Tesseract_s ... igital.git

С моими обученными данными, чтобы получить хорошие результаты OCR, я проделал эти этапы (я сделал это с OpenCV):
  • Во-первых, преобразуйте изображение в черно-белое.
  • Во-вторых, примените к изображению размытие по Гауссу.
  • В-третьих, примените к изображению пороговый фильтр.
При этом распознаются семь сегментов цифр.

ВОПРОС:

Я пытаюсь получить распознавание текста через Tesseract на Android и тестирую приложение с этим изображением (с помощью обнаружения текста на семисегментном дисплее с помощью Tesseract OCR):

Изображение


Я использую данные, обработанные arturaugusto (https://github.com/arturaugusto/display_ocr), но неправильный результат OCR:

884288

Ноль распознается как восьмерка, и я не знаю почему.

Я подаю заявку на изображение с размытием по Гауссу и пороговым фильтром через OpenCV, а обработанное изображение следующее:

Изображение


Есть ли какие-либо другие обработанные данные или вы знаете какой-либо способ решить проблему?

Подробнее здесь: https://stackoverflow.com/questions/304 ... seract-ocr
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Android»