Pytesseract неправильное распознавание текста, когда слова находятся близко друг к другу

Pytesseract неправильное распознавание текста, когда слова находятся близко друг к другу ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Pytesseract неправильное распознавание текста, когда слова находятся близко друг к другу

Цитата

Сообщение Anonymous » 01 ноя 2024, 17:27

Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает «FORREST C. BLopGetTrT» вместо FORREST C. BLODGETT. Результат кода, который я получаю
изображение, которое я использую , который содержит много имен.
Я подозреваю, что буквы расположены слишком близко друг к другу, а на изображении заглавные буквы разного размера. Я попробовал увеличить размер изображения, но это не помогло. Регистр (заглавный или строчный) здесь не имеет значения. Есть ли способ решить проблему и получить правильное имя?
мой код

Код: Выделить всё

from pytesseract import image_to_string
import pytesseract
from PIL import Image
import cv2

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

img = cv2.imread("textimg.png")
(h, w) = img.shape[:2]
img = cv2.resize(img, (w*20, h*20))
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thr = cv2.threshold(gry, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
txt = image_to_string(thr, lang="eng")
print(txt)

Я попробовал увеличить размер изображения, но это не помогло.

Подробнее здесь: https://stackoverflow.com/questions/791 ... each-other

1730471243

Anonymous

Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает «FORREST C. BLopGetTrT» вместо FORREST C. BLODGETT. Результат кода, который я получаю
изображение, которое я использую , который содержит много имен.
Я подозреваю, что буквы расположены слишком близко друг к другу, а на изображении заглавные буквы разного размера. Я попробовал увеличить размер изображения, но это не помогло. Регистр (заглавный или строчный) здесь не имеет значения. Есть ли способ решить проблему и получить правильное имя?
мой код
[code]from pytesseract import image_to_string
import pytesseract
from PIL import Image
import cv2

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

img = cv2.imread("textimg.png")
(h, w) = img.shape[:2]
img = cv2.resize(img, (w*20, h*20))
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thr = cv2.threshold(gry, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
txt = image_to_string(thr, lang="eng")
print(txt)
[/code]
Я попробовал увеличить размер изображения, но это не помогло. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79147597/pytesseract-wrong-text-recognition-when-word-are-close-to-each-other[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pytesseract неправильное распознавание текста, когда слова находятся близко друг к другу

Последнее сообщение Anonymous « 01 ноя 2024, 14:29
Добавлено в форуме Python

Anonymous » 01 ноя 2024, 14:29 » в форуме Python

Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает «FORREST C. BLopGetTrT» вместо FORREST C. BLODGETT. Результат кода, который я получаю
изображение, которое я использую , который содержит много имен.
Я...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 14:29
Pytesseract неправильное распознавание текста, когда слова находятся близко друг к другу

Последнее сообщение Anonymous « 01 ноя 2024, 15:33
Добавлено в форуме Python

Anonymous » 01 ноя 2024, 15:33 » в форуме Python

Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает «FORREST C. BLopGetTrT» вместо FORREST C. BLODGETT. Результат кода, который я получаю
изображение, которое я использую , который содержит много имен.
Я...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 15:33
Pytesseract неправильное распознавание текста, когда слова находятся близко друг к другу

Последнее сообщение Anonymous « 01 ноя 2024, 19:00
Добавлено в форуме Python

Anonymous » 01 ноя 2024, 19:00 » в форуме Python

Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает «FORREST C. BLopGetTrT» вместо FORREST C. BLODGETT. Результат кода, который я получаю
изображение, которое я использую , который содержит много имен.
Я...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 19:00
Распознавание текста с помощью pytesseract и cv2 или других библиотек

Последнее сообщение Anonymous « 11 дек 2024, 20:06
Добавлено в форуме Python

Anonymous » 11 дек 2024, 20:06 » в форуме Python

Загрузите файл PNG и сохраните его как «sample.png».

.png

Я хочу извлечь английские символы из файла png.
import cv2
import pytesseract

img = cv2.imread( sample.png )
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thr = cv2.adaptiveThreshold(gry,...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
11 дек 2024, 20:06
Распознавание текста с помощью pytesseract и cv2 или других библиотек

Последнее сообщение Anonymous « 14 дек 2024, 12:42
Добавлено в форуме Python

Anonymous » 14 дек 2024, 12:42 » в форуме Python

Загрузите файл PNG и сохраните его как «sample.png».

.png

Я хочу извлечь английские символы из файла png.
import cv2
import pytesseract

img = cv2.imread( sample.png )
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thr = cv2.adaptiveThreshold(gry,...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
14 дек 2024, 12:42

Вернуться в «Python»