изображение, которое я использую , который содержит много имен.
Я подозреваю, что буквы расположены слишком близко друг к другу. Я попробовал увеличить размер изображения, но это не помогло. Регистр (заглавный или строчный) здесь не имеет значения. Есть ли способ решить проблему и получить правильное имя?
мой код
Код: Выделить всё
from pytesseract import image_to_string
import pytesseract
from PIL import Image
import cv2
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
img = cv2.imread("textimg.png")
(h, w) = img.shape[:2]
img = cv2.resize(img, (w*20, h*20))
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thr = cv2.threshold(gry, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
txt = image_to_string(thr, lang="eng")
print(txt)
Подробнее здесь: https://stackoverflow.com/questions/791 ... each-other