Pytesseract OCR распознает «о» как «0».

Pytesseract OCR распознает «о» как «0». ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 09 июл 2024, 00:47

Я пытаюсь прочитать текст на этом изображении, используя библиотеку pytesseract.
original-screenshot.png
Вот мой код:< /p>

Код: Выделить всё

path = 'original-screenshot.png'

image = cv2.imread(path)
image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
image = cv2.adaptiveThreshold(image, 255, cv2.ADAPTIVE_THRESH_MEAN_C,
cv2.THRESH_BINARY_INV, 101, -69)

cv2.imwrite('screenshot.png', image)

custom_config = r'--oem 3 --psm 7 -l eng -c tessedit_char_whitelist=abcdefghigklmnopqrstuvwxyz0123456789'
text = pytesseract.image_to_string(image, config=custom_config)

print(text)

Обработанное изображение:
screenshot.png
Вывод текста:

Код: Выделить всё

01991f5

Ожидаемый результат:

Код: Выделить всё

o1991f5

Подробнее здесь: https://stackoverflow.com/questions/787 ... zes-o-as-0

1720475233

Anonymous

Я пытаюсь прочитать текст на этом изображении, используя библиотеку pytesseract.
original-screenshot.png
Вот мой код:< /p>
[code]path = 'original-screenshot.png'

image = cv2.imread(path)
image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
image = cv2.adaptiveThreshold(image, 255, cv2.ADAPTIVE_THRESH_MEAN_C,
cv2.THRESH_BINARY_INV, 101, -69)

cv2.imwrite('screenshot.png', image)

custom_config = r'--oem 3 --psm 7 -l eng -c tessedit_char_whitelist=abcdefghigklmnopqrstuvwxyz0123456789'
text = pytesseract.image_to_string(image, config=custom_config)

print(text)
[/code]
Обработанное изображение:
screenshot.png
Вывод текста:
[code]01991f5[/code]
Ожидаемый результат:
[code]o1991f5[/code] 

Подробнее здесь: [url]https://stackoverflow.com/questions/78722962/pytesseract-ocr-recognizes-o-as-0[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pytesseract OCR не распознает цифры в чистом двоичном изображении

Последнее сообщение Anonymous « 19 ноя 2024, 05:28
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 05:28 » в форуме Python

Я хочу распознать рукописную цифру в двоичном изображении.
Я планировал использовать tesseract ocr, но мне так и не удалось добиться точности выше 50 %. Вот часть кода, который я использовал:
plt.imshow(roi,cmap='gray')
plt.axis('off')
plt.show()...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 05:28
Вывод тарабарщины для PyTesseract OCR

Последнее сообщение Anonymous « 21 май 2024, 06:14
Добавлено в форуме Python

Anonymous » 21 май 2024, 06:14 » в форуме Python

pytesseract.pytesseract.tesseract_cmd = C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe
def extract_text(image):
gray = image.convert('L')
enhancer = ImageEnhance.Contrast(gray)
enhanced_image = enhancer.enhance(2)
enhanced_image =...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
21 май 2024, 06:14
Обнаружить текст в формате «числовая единица», используя pytesseract OCR ValueError при преобразовании числа в число с п

Последнее сообщение Anonymous « 16 сен 2024, 10:49
Добавлено в форуме Python

Anonymous » 16 сен 2024, 10:49 » в форуме Python

Это из завершившегося онлайн-хакатона (извлечение значений сущностей объектов из изображений). Я новичок, но сначала попробовал создать функцию ocr для извлечения текста из предварительно обработанных изображений и передачи его через Функция...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 10:49
Обнаружить текст в формате «числовая единица», используя pytesseract OCR ValueError при преобразовании числа в число с п

Последнее сообщение Anonymous « 16 сен 2024, 13:55
Добавлено в форуме Python

Anonymous » 16 сен 2024, 13:55 » в форуме Python

Это из завершившегося онлайн-хакатона (извлечение значений сущностей объектов из изображений). Я новичок, но сначала попробовал создать функцию ocr для извлечения текста из предварительно обработанных изображений и передачи его через Функция...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 13:55
Pytesseract OCR не обнаруживает числа длиной менее 3 цифр

Последнее сообщение Anonymous « 29 сен 2024, 00:35
Добавлено в форуме Python

Anonymous » 29 сен 2024, 00:35 » в форуме Python

У меня есть скрипт Python, который захватывает сегмент экрана, считывает его текстовое значение и преобразует текст только в числовые символы, возвращая его. Моя проблема в том, что pytesseract читает только числа, цифры которых равны 3 или больше,...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
29 сен 2024, 00:35

Вернуться в «Python»