Код: Выделить всё
% ocrmypdf --force-ocr --deskew --rotate-pages --rotate-pages-threshold 1.0 --oversample 600
Мы также попытались улучшить конкретные страницы с помощью ImageMagick до работы OCRMYPDF, и, хотя это помогает биться в сочинениях, это сильно размывает их. Образец запуска: < /p>
Код: Выделить всё
magick -brightness-contrast -20x40 -depth 8 -colors 8
Есть ли другие способы, которыми мы можем рассмотреть вопрос о подходе этой проблемы? Должны ли мы рассмотреть другой усилитель изображения, а затем запуск OCR?
Подробнее здесь: https://stackoverflow.com/questions/794 ... es-in-pdfs