Как обнаружить ориентацию изображения внутри PDF?Php

Кемеровские программисты php общаются здесь
Ответить
Anonymous
 Как обнаружить ориентацию изображения внутри PDF?

Сообщение Anonymous »

Я новичок в использовании https://github.com/smalot/pdfparser, чтобы извлечь текст из одностраничных PDF, которые не зашифрованы. Пример здесь. (Я вернусь к этому файлу через минуту.) Простой сканер страницы используется для создания этих PDF -файлов, и, как таковой, «текст» на странице - это изображение, а не работоспособный текст. Я ожидал этого. < /P>
Я хотел бы написать сценарий PHP для достижения этого, и я планирую использовать PDFPARSER, так как это единственный процессор библиотеки PDF, который я мог бы найти для PHP, который читает содержание PDF. (Исправления к этому приветствуются.) В целом, идея состоит в том, чтобы:
открыть файл и создать класс
Извлечь единственное изображение
call на Tesseract для преобразования изображения в текст < /p>
Я сделал это успешно для нескольких файлов, но для некоторых (например, предоставленный пример), изображение на самом деле хранится вверх. (Если у вас нет инструментов, чтобы увидеть это, этот файл является извлеченным, нетронутым изображением.) < /P>
Очевидно, что инструменты, которые в конечном итоге отображают это изображение пользователю, могут понять и исправить для ориентации, но я не смог найти какие -либо свойства, используя PDFPARSER, который позволит мне обнаружить это. Я нашел ширину и высоту страницы, и эти значения, кажется, похожи на (из-за отсутствия лучшего термина) «правого шага» и «перевернутого» IAMGES. Если бы я мог обнаружить вертикальную ориентацию, я мог бы перевернуть это изображение в памяти по мере необходимости, и Tesseract может обработать его. (В качестве доказательства концепции этот код теперь делает это, но безоговорочно.) Я не очень обеспокоен производительностью-это будет сделано только со скоростью, максимум, два или три в неделю. < /P>
Мой самый базовый код, который работает с этим файлом (только потому, что я заставил его), следует. Если вы запустите это с помощью rotate_image, определяемого как false, вы увидите, что происходит без вращения. Это красиво, но не полезно. < /P>

Код: Выделить всё

#!/usr/bin/env php


Подробнее здесь: [url]https://stackoverflow.com/questions/79664156/how-to-detect-orientation-of-an-image-inside-pdf[/url]
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Php»