Преобразование PDF-файла без поиска в PDF-файл с возможностью поиска в Windows PythonPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Преобразование PDF-файла без поиска в PDF-файл с возможностью поиска в Windows Python

Сообщение Anonymous »

Нужно решение для преобразования PDF-файла, где каждая страница представляет собой изображение, а страница может содержать текст, таблицу или их комбинацию, в PDF-файл с возможностью поиска.

Мне Я использовал ABBY FineReader Online, который отлично справляется со своей задачей, но я ищу решение, которое можно реализовать с помощью Windows Python

У меня есть проведен подробный анализ, и ниже приведены ссылки, которые приблизились к тому, что Я хочу, но не совсем:

Отсканированное изображение/PDF в изображение/PDF с возможностью поиска

Рекомендуется использовать Сценарий Ghost сначала преобразует его в изображение, а затем напрямую преобразует в текст. Я не верю, что tesseract преобразует PDF-файлы, не доступные для поиска, в PDF-файлы с возможностью поиска.

Преобразование PDF-файла с возможностью поиска в PDF-файл без поиска

Приведенное выше решение помогает в обратном порядке, т.е. -доступный для поиска. Также я думаю, что они действительны в Ubuntu/Linux/MacOS.

Может кто-нибудь помочь сказать, каким должен быть код Python для достижения возможности поиска в Windows Python?



ОБНОВЛЕНИЕ 1

Я получил желаемый результат с помощью Asprise Web Ocr. Ниже приведена ссылка и код:

https://asprise.com/royalty-free-librar ... rview.html
Я ищу решение, которое можно реализовать только с помощью библиотек Windows Python
  • Не нужно будет платить за подписку в будущем.
  • Мне нужно конвертировать тысячи документов ежедневно, и будет сложно загрузить один в API, а затем скачать и так далее.
ОБНОВЛЕНИЕ 2

Я знаю решение, заключающееся в преобразовании PDF-файла, не поддерживающего поиск, непосредственно в текст. Но я ищу способ конвертировать PDF-файлы без возможности поиска в PDF-файлы с возможностью поиска. У меня есть код для преобразования PDF в текст с помощью PyPDF2.

Подробнее здесь: https://stackoverflow.com/questions/519 ... ows-python
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Преобразование PDF-файла без поиска в PDF-файл с возможностью поиска в Windows Python
    Anonymous » » в форуме Python
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous
  • Jquery Drag drop – один список с возможностью сортировки и другой список с возможностью перетаскивания и удаления без со
    Anonymous » » в форуме Jquery
    0 Ответы
    23 Просмотры
    Последнее сообщение Anonymous
  • Как создать меню выбора с возможностью поиска в SwiftUI
    Anonymous » » в форуме IOS
    0 Ответы
    31 Просмотры
    Последнее сообщение Anonymous
  • Примечания к выпуску pandas с возможностью поиска
    Anonymous » » в форуме Python
    0 Ответы
    22 Просмотры
    Последнее сообщение Anonymous
  • Создание поля выбора с возможностью поиска
    Anonymous » » в форуме Jquery
    0 Ответы
    12 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»