Как: улучшить качество PDF перед распознаванием текста с помощью C#

Как: улучшить качество PDF перед распознаванием текста с помощью C# ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Как: улучшить качество PDF перед распознаванием текста с помощью C#

Сообщение Anonymous » 27 фев 2026, 18:45

Я создаю службу, которая отслеживает папку на наличие отсканированных файлов. Как только файл окажется там, служба подберет его и преобразует в читаемый PDF-файл. В этом процессе служба также ищет штрих-код. После этого текст извлекается и файл с его текстом сохраняется в базе данных нашего программного обеспечения. Местоположение основано на штрих-коде.

Теперь для оптического распознавания символов мы используем SDK Atalasoft (http://www.atalasoft.com/).
Также в этот SDK включен распознаватель штрих-кода.

Но преобразованный текст по-прежнему содержит некоторые ошибки. (Я провел несколько тестов с другими программами OCR, но Atalasoft показал себя хорошо.)
Я ищу программное обеспечение (SDK-kit), которое позволит мне улучшить качество PDF-файла для целей OCR.

Я протестировал Kofax VRS Elite (http://www.kofax.com/vrs-virtualrescan/). Я ищу что-то подобное, но это можно реализовать в сервисе с помощью какого-то SDK-кита.

Кто-нибудь делал это раньше или имел подобные проблемы?
заранее спасибо!

Подробнее здесь: https://stackoverflow.com/questions/659 ... ng-c-sharp

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «C#»