Чтобы извлечь логотип и максимально точный текст из отсканированного PDF-файла с помощью OCR и Python.

Чтобы извлечь логотип и максимально точный текст из отсканированного PDF-файла с помощью OCR и Python. ⇐ Python

1 сообщение • Страница 1 из 1

Гость

Чтобы извлечь логотип и максимально точный текст из отсканированного PDF-файла с помощью OCR и Python.

Цитата

Сообщение Гость » 07 мар 2024, 13:42

So I want to extract logo and tabular data from scanned invoice PDF. When I try to extract logos as images with using pypdf2 library, I have result whole document as image. That is why I can not reach the logo.

And another problem is that, when I use the Pytesseract for extracting tabular text data, my output was not logic and OCR did not return correct outputs.

Which way should I follow to extract these things ?

I try to convert pdf to image and manipulate that image and convert again to pdf. Then I try to read text with using pdfreader libraries (e.g. pdfplumber, pypdf2, etc.) But I did not get any acceptable results.

Источник: https://stackoverflow.com/questions/781 ... -and-pytho

1709808173

Гость


So I want to extract logo and tabular data from scanned invoice PDF. When I try to extract logos as images with using pypdf2 library, I have result whole document as image. That is why I can not reach the logo.
 
And another problem is that, when I use the Pytesseract for extracting tabular text data, my output was not logic and OCR did not return correct outputs.
 
Which way should I follow to extract these things ?
 
I try to convert pdf to image and manipulate that image and convert again to pdf. Then I try to read text with using pdfreader libraries (e.g. pdfplumber, pypdf2, etc.) But I did not get any acceptable results.
 

Источник: [url]https://stackoverflow.com/questions/78120669/to-extract-logo-and-most-accurate-text-from-scanned-pdf-with-using-ocr-and-pytho[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Tesseract OCR не читая размытый или разбитый текст из изображения-нужен точный метод изображения в текст

Последнее сообщение Anonymous « 20 июн 2025, 12:48
Добавлено в форуме C#

Anonymous » 20 июн 2025, 12:48 » в форуме C#

В настоящее время я использую двигатель tesseract-ocr в моем приложении для извлечения текста из изображений. Хотя это хорошо работает во многих случаях, я сталкиваюсь с проблемами, в которых он не может читать размытый или частично сломанный текст...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
20 июн 2025, 12:48
Извлечение маркированных диаграмм из отсканированного PDF-файла, например вопросника

Последнее сообщение Anonymous « 30 июл 2024, 00:08
Добавлено в форуме Python

Anonymous » 30 июл 2024, 00:08 » в форуме Python

Пример изображения страницы PDF
Мне нужно извлечь изображения или диаграммы из отсканированного PDF-файла с помощью Python, где нет четких границ между изображениями и текстом. Для текста я могу выполнить распознавание текста, но для диаграмм такие...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 00:08
Встроить/вставить/добавить данные JSON OCR, сгенерированные Google Cloud Vision (OCR)», в файл PDF и сделать PDF доступн

Последнее сообщение Anonymous « 25 июн 2024, 00:40
Добавлено в форуме Php

Anonymous » 25 июн 2024, 00:40 » в форуме Php

Я использую Google Cloud Vision API (OCR) для обнаружения текста в файлах PDF с помощью библиотеки PHP API. Оптическое распознавание текста выполнено идеально, и я сохранил полный набор выходных файлов JSON (например, output-1-to-2.json) с полными...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
25 июн 2024, 00:40
Встроить/вставить/добавить данные JSON OCR, сгенерированные Google Cloud Vision (OCR)», в файл PDF и сделать PDF доступн

Последнее сообщение Anonymous « 13 июл 2024, 14:46
Добавлено в форуме Php

Anonymous » 13 июл 2024, 14:46 » в форуме Php

Я использую Google Cloud Vision API (OCR) для обнаружения текста в файлах PDF с помощью библиотеки PHP API. Оптическое распознавание текста выполнено идеально, и я сохранил полный набор выходных файлов JSON (например, output-1-to-2.json) с полными...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
13 июл 2024, 14:46
Встроить/вставить/добавить данные JSON OCR, сгенерированные Google Cloud Vision (OCR)», в файл PDF и сделать PDF доступн

Последнее сообщение Anonymous « 14 июл 2024, 00:01
Добавлено в форуме Php

Anonymous » 14 июл 2024, 00:01 » в форуме Php

Я использую Google Cloud Vision API (OCR) для обнаружения текста в файлах PDF с помощью библиотеки PHP API. Оптическое распознавание текста выполнено идеально, и я сохранил полный набор выходных файлов JSON (например, output-1-to-2.json) с полными...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
14 июл 2024, 00:01

Вернуться в «Python»