PDF-файл, отсканированный с помощью OCR [закрыто]Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 PDF-файл, отсканированный с помощью OCR [закрыто]

Сообщение Anonymous »

Мне нужно извлечь информацию с помощью OCR из двух отсканированных PDF-файлов ниже. Я пробовал использовать традиционные инструменты оптического распознавания символов, а также запускал модели из Layout Parser, например PubLay, а также пытался создать собственный шаблон с помощью Label Studio, но это не сработало. Мне рекомендовали использовать PubLay для макетов с несколькими столбцами. Как его настроить и выполнить извлечение информации?
Пример PDF-документа представлен на этих двух изображениях.
Изображение
Изображение


Подробнее здесь: https://stackoverflow.com/questions/789 ... canned-pdf
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»