Мне пришлось обучать свои собственные данные, чтобы попробовать их с помощью OCR. Кажется, это работает хорошо, но я не знаю, почему обученные данные из arturaugusto не работают для меня =(
https://github.com/adri1992/Tesseract_s ... igital.git
С моими обученными данными, чтобы получить хорошие результаты OCR, я проделал эти этапы (я сделал это с OpenCV):
- Во-первых, преобразуйте изображение в черно-белое.
- Во-вторых, примените к изображению размытие по Гауссу.
- В-третьих, примените к изображению пороговый фильтр.
ВОПРОС:
Я пытаюсь получить распознавание текста через Tesseract на Android и тестирую приложение с этим изображением (с помощью обнаружения текста на семисегментном дисплее с помощью Tesseract OCR):

Я использую данные, обработанные arturaugusto (https://github.com/arturaugusto/display_ocr), но неправильный результат OCR:
884288
Ноль распознается как восьмерка, и я не знаю почему.
Я подаю заявку на изображение с размытием по Гауссу и пороговым фильтром через OpenCV, а обработанное изображение следующее:

Есть ли какие-либо другие обработанные данные или вы знаете какой-либо способ решить проблему?
Подробнее здесь: https://stackoverflow.com/questions/304 ... seract-ocr
Мобильная версия