Pytesseract неправильное распознавание текста, когда слова находятся близко друг к другуPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Pytesseract неправильное распознавание текста, когда слова находятся близко друг к другу

Сообщение Anonymous »

Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает «FORREST C. BLopGetTrT» вместо FORREST C. BLODGETT. Результат кода, который я получаю
изображение, которое я использую , который содержит много имен.
Я подозреваю, что буквы расположены слишком близко друг к другу, а на изображении заглавные буквы разного размера. Я попробовал увеличить размер изображения, но это не помогло. Регистр (заглавный или строчный) здесь не имеет значения. Есть ли способ решить проблему и получить правильное имя?
мой код

Код: Выделить всё

from pytesseract import image_to_string
import pytesseract
from PIL import Image
import cv2

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

img = cv2.imread("textimg.png")
(h, w) = img.shape[:2]
img = cv2.resize(img, (w*20, h*20))
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thr = cv2.threshold(gry, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
txt = image_to_string(thr, lang="eng")
print(txt)
Я попробовал увеличить размер изображения, но это не помогло.

Подробнее здесь: https://stackoverflow.com/questions/791 ... each-other
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»