Pytesseract/Распознавание символов + цифр + пробеловPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Pytesseract/Распознавание символов + цифр + пробелов

Сообщение Anonymous »

Я хотел бы распознать текст (с цифрами и пробелами) на изображении, используя следующий код:

Код: Выделить всё

erg = pytesseract.image_to_string(img)
В целом с этим все работает нормально, но я также получаю нежелательный персонаж, например Ô

Код: Выделить всё

ÔAU OPTRONICS CORPORATION

() Preliminary Specification
(V) Final Specification
Module 18.5" Color TFT-LCD
Model Name (G18SHANOT.O
Customer Date ÔApproved by Date
Crystal Hsieh 2016/06/29
Approved by Propared by
Поэтому я попытался внести тессеракт в белый список, используя вместо этого следующий код:

Код: Выделить всё

workString =f'-c tessedit\_char\_whitelist={string.digits}(){string.ascii\_letters}'
erg = pytesseract.image\_to\_string(img, config=workString)
При этом я получаю следующий текст - кажется, что Ô не выводится - но, к сожалению, пробелов больше нет -
AUOPTRONICSCORPORATION

Код: Выделить всё

()ProliminarySpecification
(V)FinalSpecification
Module 185ColorTFTLCD
ModelName (G18SHANOTO
Customer Date Approvedby Date
CrstalHsieh 2016(06)29
Approvedby Proparedby
Есть ли способ внести в белый список символы и цифры, но при этом выводить пробелы/пробелы?

Подробнее здесь: https://stackoverflow.com/questions/781 ... its-spaces
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»