Попытка получить точное распознавание текста в Python

Попытка получить точное распознавание текста в Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Попытка получить точное распознавание текста в Python

Цитата

Сообщение Anonymous » 26 июн 2024, 00:51

Я пытаюсь получить текст из PDF-документов с помощью pytesseract, но это оказывается очень неточно. В частности, я пытаюсь прочитать нижнюю часть страницы, где написано ZI2440A, но печатается Z12440A. Есть ли способ лучше обработать это изображение перед распознаванием текста или есть другой инструмент, который будет работать лучше?
Я прикрепил PDF-файл, уже преобразованный в jpg, который я использовал, с помощью конфиденциальная информация заблокирована. Я также приложил свой простой код.
Тестовый документ

Код: Выделить всё

import pytesseract
from pdf2image import convert_from_path

file = r"C:\Users\jkaplan\Documents\2023_HYDE, MATTHEW_SIGNED E-FILE AUTHORIZATION FORM.pdf"
image = convert_from_path(file, use_pdftocairo=True)
image[0].save('testdoc.jpg')
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
text = pytesseract.image_to_string(image[0], lang="eng")
print(text)

Я пытался воспроизвести этот код с помощью pypdf и pdfminer, но они оба прочитали этот символ как 1 вместо I.

Подробнее здесь: https://stackoverflow.com/questions/786 ... -in-python

1719352302

Anonymous

Я пытаюсь получить текст из PDF-документов с помощью pytesseract, но это оказывается очень неточно. В частности, я пытаюсь прочитать нижнюю часть страницы, где написано Z[b]I[/b]2440A, но печатается Z[b]1[/b]2440A. Есть ли способ лучше обработать это изображение перед распознаванием текста или есть другой инструмент, который будет работать лучше?
Я прикрепил PDF-файл, уже преобразованный в jpg, который я использовал, с помощью конфиденциальная информация заблокирована. Я также приложил свой простой код.
Тестовый документ
[code]import pytesseract
from pdf2image import convert_from_path

file = r"C:\Users\jkaplan\Documents\2023_HYDE, MATTHEW_SIGNED E-FILE AUTHORIZATION FORM.pdf"
image = convert_from_path(file, use_pdftocairo=True)
image[0].save('testdoc.jpg')
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
text = pytesseract.image_to_string(image[0], lang="eng")
print(text)
[/code]
Я пытался воспроизвести этот код с помощью pypdf и pdfminer, но они оба прочитали этот символ как 1 вместо I. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78669634/trying-to-get-accurate-ocr-in-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ищу более точное распознавание изображения по сравнению с Pyautogui. (Clash of Clans - Bot) [Закрыто]

Последнее сообщение Anonymous « 28 апр 2025, 13:58
Добавлено в форуме Python

Anonymous » 28 апр 2025, 13:58 » в форуме Python

Я думаю, просто обычная идея Python. Хотел создать бота, который ищет основу самостоятельно , пока не будет найдено, что не будет найдено в соответствии с необходимым минимумом (это использовало это с использованием pyautogui и pytesseract ,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
28 апр 2025, 13:58
Точное обнаружение случайно повернутого текста на изображениях

Последнее сообщение Anonymous « 03 июл 2024, 12:54
Добавлено в форуме Python

Anonymous » 03 июл 2024, 12:54 » в форуме Python

Я пытаюсь обнаружить текст среди элементов, которые можно вращать в разных направлениях. Я пробовал использовать Tesseract, EasyOCR и EAST для обнаружения и извлечения текста, но столкнулся с проблемами с повернутым текстом. Тессеракт дал мне...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 12:54
Точное обнаружение случайно повернутого текста на изображениях

Последнее сообщение Anonymous « 08 июл 2024, 15:26
Добавлено в форуме Python

Anonymous » 08 июл 2024, 15:26 » в форуме Python

Я пытаюсь обнаружить текст среди элементов, которые можно вращать в разных направлениях. Я пробовал использовать Tesseract, EasyOCR и EAST для обнаружения и извлечения текста, но столкнулся с проблемами с повернутым текстом. Тессеракт дал мне...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
08 июл 2024, 15:26
Google ML Kit Распознавание текста версии 2. В отдельной библиотеке возникла проблема с распознаванием чисел как символо

Последнее сообщение Гость « 07 мар 2024, 13:42
Добавлено в форуме Android

Гость » 07 мар 2024, 13:42 » в форуме Android

I am currently developing an OCR-based card scanner android app using CameraX and Google ML Kit Text Recognitionv2. While the app performs reasonably well with regular printed text, it struggles to accurately recognize numbers on embossed cards,...

0 Ответы

38 Просмотры

Последнее сообщение Гость
07 мар 2024, 13:42
Как реализовать и выполнить распознавание текста в проекте C#? [закрыто]

Последнее сообщение Anonymous « 25 сен 2024, 08:43
Добавлено в форуме C#

Anonymous » 25 сен 2024, 08:43 » в форуме C#

Я некоторое время искал и видел запросы к библиотеке OCR. Я хотел бы знать, как реализовать самую чистую, простую в установке и использовании библиотеку OCR с подробной информацией для установки в проект C #.

Если возможно, я просто хочу...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 08:43

Вернуться в «Python»