В настоящее время я использую двигатель tesseract-ocr в моем приложении для извлечения текста из изображений. Хотя это хорошо работает во многих случаях, я сталкиваюсь с проблемами, в которых он не может читать размытый или частично сломанный текст , особенно когда изображение содержит:
Маленькие или антилисные шрифты
blurry. /> цифры или символы, такие как/, %,. , которые кажутся разбитыми или неясными
В настоящее время я использую двигатель [b] tesseract-ocr [/b] в моем приложении для извлечения текста из изображений. Хотя это хорошо работает во многих случаях, я сталкиваюсь с проблемами, в которых он не может читать размытый или частично сломанный текст , особенно когда изображение содержит: [list] [*] Маленькие или антилисные шрифты
[*] blurry. /> цифры или символы, такие как/, %,. , которые кажутся разбитыми или неясными
[/list] Я уже пробовал: [list] [*] preprocass in opence> openc> openc> openc>