Мне пришлось обучать свои собственные данные, чтобы попробовать их с помощью OCR. Кажется, это работает хорошо, но я не знаю, почему обученные данные из arturaugusto не работают для меня =(
https://github.com/adri1992/Tesseract_s ... igital.git
С моими обученными данными, чтобы получить хорошие результаты OCR, я выполнил следующие этапы (Я сделал это с помощью OpenCV):
- Во-первых, преобразуйте изображение в черно-белое.
- Во-вторых, примените к изображению размытие по Гауссу.
- В-третьих, примените к изображению пороговый фильтр.
ВОПРОС:
Я пытаюсь получить распознавание текста через Tesseract на Android и тестирую приложение с этим изображением (с помощью обнаружения текста на семисегментном дисплее с помощью Tesseract OCR):

Я использую данные, обработанные arturaugusto (https://github.com/arturaugusto/display_ocr), но неправильный результат оптического распознавания символов:
884288
Ноль распознается как восьмерка, и я не знаю, почему.
Я применяю к изображению размытие по Гауссу и пороговый фильтр через OpenCV, и изображение обрабатывается следующим образом:

Есть ли какие-либо другие обработанные данные или вы знаете какой-либо способ решения проблемы?
Подробнее здесь: https://stackoverflow.com/questions/304 ... seract-ocr
Мобильная версия