Мне пришлось обучать свои собственные данные, чтобы попробовать их с помощью OCR. Кажется, это работает хорошо, но я не знаю, почему у меня не работают обученные данные от arturaugusto =(
https://github.com/adri1992/Tesseract_s ... sGoDigital .git
С моими обученными данными, чтобы получить хорошие результаты оптического распознавания символов, я выполнил следующие этапы (я сделал это с помощью OpenCV):
- Сначала преобразуйте изображение в черно-белое
- Во-вторых, примените к изображению размытие по Гауссу
- В-третьих, примените к изображению пороговый фильтр.
p>
ВОПРОС:
Я пытаюсь получить OCR через Tesseract на Android, и я тестирую приложение с этим изображением (с помощью обнаружения текста на семисегментном дисплее с помощью Tesseract OCR):

Я использую данные, подготовленные arturaugusto (https://github.com/arturaugusto /display_ocr), но неправильный результат оптического распознавания символов:
884288
Ноль распознается как восемь, и я не знаю почему.
Я применяю к изображению размытие по Гауссу и пороговый фильтр через OpenCV, и обрабатывается следующее изображение:

Есть ли какие-либо другие данные или вы знаете какой-либо способ решения проблемы?
Подробнее здесь: https://stackoverflow.com/questions/304 ... seract-ocr