Распознавание чисел на скриншоте с помощью tesseract в Python

Распознавание чисел на скриншоте с помощью tesseract в Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Распознавание чисел на скриншоте с помощью tesseract в Python

Цитата

Сообщение Anonymous » 09 июл 2024, 00:40

Я пишу программу, предназначенную для распознавания чисел на скриншоте и заполнения ими массива. В целом программа работает хорошо, но иногда возникают проблемы: единицы либо не распознаются, либо распознаются как четверки. Прилагаю код программы и результат выполнения скрипта, где видно, что число 100 000 было распознано как 00000. Пробовал использовать разные параметры --oem и --psm, но ошибки сохраняются в любом случае.

Код: Выделить всё

import cv2
import pytesseract
import re
import pyautogui
import numpy as np

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

def screen():
screen_for_array = pyautogui.screenshot()
screen = np.array(screen_for_array)
screen = cv2.cvtColor(screen, cv2.COLOR_RGB2BGR)
return screen

def recognize_numbers(image, x, y, w, h):
roi = image[y:y+h, x:x+w]
gray = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)

cv2.imshow('Image', gray)
cv2.waitKey(0)
cv2.destroyAllWindows()

custom_config = r'--oem 3 --psm 6 -c tessedit_char_whitelist=0123456789'
text = pytesseract.image_to_string(gray, config=custom_config)

numbers = re.findall(r'\d+', text)

return numbers

image_path = screen()
x, y, w, h = 333, 380, 90, 344
numbers = recognize_numbers(image_path, x, y, w, h)
print("number recognition:", numbers)

введите сюда описание изображения
Результат распознавания этого снимка экрана следующий: ['95000', '97000', '98111', '98123', '99999', '00000', '110000', '120000', '125000', '149990']
Кстати, это изображение является финальной версией, которую программа использует для распознавания.
Я пробовал использовать разные параметры --oem и --psm, но ошибки в любом случае сохраняются. Я использовал как цветное изображение скриншота, так и черно-белое (которое вы можете увидеть на прикрепленном скриншоте).

Подробнее здесь: https://stackoverflow.com/questions/787 ... -in-python

1720474806

Anonymous

Я пишу программу, предназначенную для распознавания чисел на скриншоте и заполнения ими массива. В целом программа работает хорошо, но иногда возникают проблемы: единицы либо не распознаются, либо распознаются как четверки. Прилагаю код программы и результат выполнения скрипта, где видно, что число 100 000 было распознано как 00000. Пробовал использовать разные параметры --oem и --psm, но ошибки сохраняются в любом случае.
[code]import cv2
import pytesseract
import re
import pyautogui
import numpy as np

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

def screen():
screen_for_array = pyautogui.screenshot()
screen = np.array(screen_for_array)
screen = cv2.cvtColor(screen, cv2.COLOR_RGB2BGR)
return screen

def recognize_numbers(image, x, y, w, h):
roi = image[y:y+h, x:x+w]
gray = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)

cv2.imshow('Image', gray)
cv2.waitKey(0)
cv2.destroyAllWindows()

custom_config = r'--oem 3 --psm 6 -c tessedit_char_whitelist=0123456789'
text = pytesseract.image_to_string(gray, config=custom_config)

numbers = re.findall(r'\d+', text)

return numbers

image_path = screen()
x, y, w, h = 333, 380, 90, 344
numbers = recognize_numbers(image_path, x, y, w, h)
print("number recognition:", numbers)
[/code]
введите сюда описание изображения
Результат распознавания этого снимка экрана следующий: ['95000', '97000', '98111', '98123', '99999', '00000', '110000', '120000', '125000', '149990']
Кстати, это изображение является финальной версией, которую программа использует для распознавания.
Я пробовал использовать разные параметры --oem и --psm, но ошибки в любом случае сохраняются. Я использовал как цветное изображение скриншота, так и черно-белое (которое вы можете увидеть на прикрепленном скриншоте). 

Подробнее здесь: [url]https://stackoverflow.com/questions/78722939/recognizing-numbers-in-a-screenshot-using-tesseract-in-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

OpenCV производит ошибку "OcrtesserAct (33): tesseract не найдена" с рабочей установкой Tesseract

Последнее сообщение Anonymous « 22 июн 2025, 07:44
Добавлено в форуме Python

Anonymous » 22 июн 2025, 07:44 » в форуме Python

Этот сценарий Python 3.12.7 с Tesserocr 2.8.0 и OpenCV-Python 4.11.0.86 работает, как и ожидалось:
import cv2 as cv
from tesserocr import PyTessBaseAPI
from PIL import Image

img = cv.imread('text.jpg')
_, img = cv.threshold(img, 180, 255,...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
22 июн 2025, 07:44
OpenCV производит ошибку "OcrtesserAct (33): tesseract не найдена" с рабочей установкой Tesseract

Последнее сообщение Anonymous « 22 июн 2025, 15:18
Добавлено в форуме Python

Anonymous » 22 июн 2025, 15:18 » в форуме Python

Когда я пытаюсь использовать Tesseract из OpenCV-Python 4.11.0.86 с этим скриптом:
import cv2 as cv

img = cv.imread('text.jpg')
_, img = cv.threshold(img, 180, 255, cv.THRESH_BINARY_INV)
ocr =...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
22 июн 2025, 15:18
OpenCV производит ошибку "OcrtesserAct (33): tesseract не найдена" с рабочей установкой Tesseract

Последнее сообщение Anonymous « 22 июн 2025, 22:33
Добавлено в форуме Python

Anonymous » 22 июн 2025, 22:33 » в форуме Python

Когда я пытаюсь использовать Tesseract из OpenCV-Python 4.11.0.86 с этим скриптом:
import cv2 as cv

img = cv.imread('text.jpg')
_, img = cv.threshold(img, 180, 255, cv.THRESH_BINARY_INV)
ocr =...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
22 июн 2025, 22:33
Как создать наложение, невидимое на скриншоте, с помощью DirectComposition и Direct2D в C++?

Последнее сообщение Anonymous « 31 май 2024, 23:27
Добавлено в форуме C++

Anonymous » 31 май 2024, 23:27 » в форуме C++

Я пытаюсь создать наложение на C++, которое не отображается на снимках экрана. Оверлей должен быть виден пользователю, но не запечатлен на снимке экрана (что также будет выполняться кодом). Я читал, что это возможно с помощью DirectComposition и...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
31 май 2024, 23:27
Распознавание марокканских номерных знаков (LPR) с использованием OPENALPR, OpenCV и Tesseract

Последнее сообщение Anonymous « 08 дек 2024, 10:26
Добавлено в форуме Python

Anonymous » 08 дек 2024, 10:26 » в форуме Python

В настоящее время я работаю над своим проектом завершения обучения: название моего проекта — «Обнаружение марокканских номерных знаков транспортных средств в режиме реального времени (ALPR)», к сожалению, я пытался опубликовать свою проблему в...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
08 дек 2024, 10:26

Вернуться в «Python»