Как: улучшить качество PDF перед распознаванием текста с помощью C#C#

Место общения программистов C#
Ответить
Anonymous
 Как: улучшить качество PDF перед распознаванием текста с помощью C#

Сообщение Anonymous »

Я создаю службу, которая отслеживает папку на наличие отсканированных файлов. Как только файл окажется там, служба подберет его и преобразует в читаемый PDF-файл. В этом процессе служба также ищет штрих-код. После этого текст извлекается и файл с его текстом сохраняется в базе данных нашего программного обеспечения. Местоположение основано на штрих-коде.

Теперь для оптического распознавания символов мы используем SDK Atalasoft (http://www.atalasoft.com/).
Также в этот SDK включен распознаватель штрих-кода.

Но преобразованный текст по-прежнему содержит некоторые ошибки. (Я провел несколько тестов с другими программами OCR, но Atalasoft показал себя хорошо.)
Я ищу программное обеспечение (SDK-kit), которое позволит мне улучшить качество PDF-файла для целей OCR.

Я протестировал Kofax VRS Elite (http://www.kofax.com/vrs-virtualrescan/). Я ищу что-то подобное, но это можно реализовать в сервисе с помощью какого-то SDK-кита.

Кто-нибудь делал это раньше или имел подобные проблемы?
заранее спасибо!

Подробнее здесь: https://stackoverflow.com/questions/659 ... ng-c-sharp
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «C#»