Pytesseract OCR распознает «о» как «0».Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Pytesseract OCR распознает «о» как «0».

Сообщение Anonymous »

Я пытаюсь прочитать текст на этом изображении, используя библиотеку pytesseract.
original-screenshot.png
Вот мой код:< /p>

Код: Выделить всё

path = 'original-screenshot.png'

image = cv2.imread(path)
image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
image = cv2.adaptiveThreshold(image, 255, cv2.ADAPTIVE_THRESH_MEAN_C,
cv2.THRESH_BINARY_INV, 101, -69)

cv2.imwrite('screenshot.png', image)

custom_config = r'--oem 3 --psm 7 -l eng -c tessedit_char_whitelist=abcdefghigklmnopqrstuvwxyz0123456789'
text = pytesseract.image_to_string(image, config=custom_config)

print(text)
Обработанное изображение:
screenshot.png
Вывод текста: Ожидаемый результат:

Подробнее здесь: https://stackoverflow.com/questions/787 ... zes-o-as-0
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»