Распознавание текста в PDF-файле, повернутом под любым угломPython

Программы на Python
Ответить
Anonymous
 Распознавание текста в PDF-файле, повернутом под любым углом

Сообщение Anonymous »

У меня есть простая программа (код из документации библиотеки docTR), распознающая текст в pdf-файле. Если текст идеально выровнен, то проблем с распознаванием текста нет, но если документ повернут вправо или влево, то начинаются проблемы с распознаванием текста.
Изображение
[img]https://i.sstatic. net/lYBxQ.png[/img]

Я могу получить документы, которые не только повернуты ровно на 90, 180 или 270 градусов. Криво отсканированные документы могут быть повернуты под любым углом (как на картинках выше).
Хотелось бы с вашей помощью найти решение, которое поможет мне повернуть таблицу/текст (или весь PDF-файл) в моем PDF-файле напрямую, для облегчения распознавания текста, как на рисунке ниже.
[img]https://i.sstatic .net/bMVtn.jpg[/img]

Возможно, подобные решения уже есть, но я их пока не нашел. Я был бы признателен, если бы вы указали мне на существующие решения или помогли мне написать код с использованием моего собственного решения.
from doctr.io import DocumentFile
from doctr.models import ocr_predictor

ocr = ocr_predictor(pretrained=True)

doc = DocumentFile.from_pdf("my/path.pdf")
result = ocr(doc)
result.show(doc)


Подробнее здесь: https://stackoverflow.com/questions/767 ... -any-angle
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»