Pytesseract OCR не распознает цифры в чистом двоичном изображенииPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Pytesseract OCR не распознает цифры в чистом двоичном изображении

Сообщение Anonymous »

Я хочу распознать рукописную цифру в двоичном изображении.
Я планировал использовать tesseract ocr, но мне так и не удалось добиться точности выше 50 %. Вот часть кода, который я использовал:

Код: Выделить всё

plt.imshow(roi,cmap='gray')
plt.axis('off')
plt.show()

text = pytesseract.image_to_string(roi, config='--psm 10')
print(text)
И нарисованное изображение:
digit_4
Текст в большинстве случаев был неправильным — в приведенном выше случае это было '+ '. Среди других неправильных ответов были «4», «UL» и «А». Изначально у меня было

Код: Выделить всё

text = pytesseract.image_to_string(roi, config='--psm 10 digits')
но удалил настройку цифр после того, как увидел, что половина текста пуста.
  • Как я могу повысить точность?< /li>
    Почему распознавание символов выводит несколько символов, если оно настроено на распознавание одного символа?
(Я использую версия 4.1.1 pytesseract)

Подробнее здесь: https://stackoverflow.com/questions/792 ... nary-image
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»