Pytesseract OCR не распознает цифры в чистом двоичном изображении

Pytesseract OCR не распознает цифры в чистом двоичном изображении ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Pytesseract OCR не распознает цифры в чистом двоичном изображении

Цитата

Сообщение Anonymous » 19 ноя 2024, 05:28

Я хочу распознать рукописную цифру в двоичном изображении.
Я планировал использовать tesseract ocr, но мне так и не удалось добиться точности выше 50 %. Вот часть кода, который я использовал:

Код: Выделить всё

plt.imshow(roi,cmap='gray')
plt.axis('off')
plt.show()

text = pytesseract.image_to_string(roi, config='--psm 10')
print(text)

И нарисованное изображение:
digit_4
Текст в большинстве случаев был неправильным — в приведенном выше случае это было '+ '. Среди других неправильных ответов были «4», «UL» и «А». Изначально у меня было

Код: Выделить всё

text = pytesseract.image_to_string(roi, config='--psm 10 digits')

но удалил настройку цифр после того, как увидел, что половина текста пуста.

Как я могу повысить точность?< /li>
Почему распознавание символов выводит несколько символов, если оно настроено на распознавание одного символа?

(Я использую версия 4.1.1 pytesseract)

Подробнее здесь: https://stackoverflow.com/questions/792 ... nary-image

1731983287

Anonymous

Я хочу распознать рукописную цифру в двоичном изображении.
Я планировал использовать tesseract ocr, но мне так и не удалось добиться точности выше 50 %. Вот часть кода, который я использовал:
[code]plt.imshow(roi,cmap='gray')
plt.axis('off')
plt.show()

text = pytesseract.image_to_string(roi, config='--psm 10')
print(text)
[/code]
И нарисованное изображение:
digit_4
Текст в большинстве случаев был неправильным — в приведенном выше случае это было '+ '. Среди других неправильных ответов были «4», «UL» и «А». Изначально у меня было
[code]text = pytesseract.image_to_string(roi, config='--psm 10 digits')[/code]
но удалил настройку цифр после того, как увидел, что половина текста пуста.
[list]
[*]Как я могу повысить точность?< /li>
Почему распознавание символов выводит несколько символов, если оно настроено на распознавание одного символа?
[/list]
(Я использую версия 4.1.1 pytesseract) 

Подробнее здесь: [url]https://stackoverflow.com/questions/79201931/pytesseract-ocr-not-recognizing-digits-in-clean-binary-image[/url]