Pytesseract OCR не обнаруживает числа длиной менее 3 цифр

Pytesseract OCR не обнаруживает числа длиной менее 3 цифр ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Pytesseract OCR не обнаруживает числа длиной менее 3 цифр

Цитата

Сообщение Anonymous » 29 сен 2024, 00:35

У меня есть скрипт Python, который захватывает сегмент экрана, считывает его текстовое значение и преобразует текст только в числовые символы, возвращая его. Моя проблема в том, что pytesseract читает только числа, цифры которых равны 3 или больше, и никогда не 2 или меньше.
Я захватил небольшой сегмент экрана и попросил pytesseract прочитать и извлечь из него текст. , но это работает только при наличии 3 или более цифр.
Пример изображения: Захваченный сегмент моего экрана
import cv2
import numpy as np
import pytesseract
import time
import pydirectinput
import pygetwindow as gw

from mss import mss
import re

def filter_numbers(text):
filtered_text = re.sub(r'\D', '', text)
return filtered_text

topMost = 1005
Pheight = 45
Pwidth = 55
leftMost = 170

useButtonCoordinateX, useButtonCoordinateY = 403, 726

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

def capture_screen_and_read_text():

region = {'top': topMost, 'left': leftMost, 'width': Pwidth, 'height': Pheight}
time.sleep(2)
with mss() as sct:
screen = sct.grab(region)

img = np.array(screen)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

_, thresh = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY)

resized_img = cv2.resize(thresh, None, fx=2, fy=2, interpolation=cv2.INTER_LINEAR)
cv2.imshow('Screen Capture', resized_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

text = pytesseract.image_to_string(resized_img)
return text

capture_screen_and_read_text()

Подробнее здесь: https://stackoverflow.com/questions/790 ... n-3-digits

1727559340

Anonymous

У меня есть скрипт Python, который захватывает сегмент экрана, считывает его текстовое значение и преобразует текст только в числовые символы, возвращая его. Моя проблема в том, что pytesseract читает только числа, цифры которых равны 3 или больше, и никогда не 2 или меньше.
Я захватил небольшой сегмент экрана и попросил pytesseract прочитать и извлечь из него текст. , но это работает только при наличии 3 или более цифр.
Пример изображения: Захваченный сегмент моего экрана
import cv2
import numpy as np
import pytesseract
import time
import pydirectinput
import pygetwindow as gw

from mss import mss
import re

def filter_numbers(text):
filtered_text = re.sub(r'\D', '', text)
return filtered_text

topMost = 1005
Pheight = 45
Pwidth = 55
leftMost = 170

useButtonCoordinateX, useButtonCoordinateY  = 403, 726

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

def capture_screen_and_read_text():

region = {'top': topMost, 'left': leftMost, 'width': Pwidth, 'height': Pheight}
time.sleep(2)
with mss() as sct:
screen = sct.grab(region)

img = np.array(screen)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

_, thresh = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY)

resized_img = cv2.resize(thresh, None, fx=2, fy=2, interpolation=cv2.INTER_LINEAR)
cv2.imshow('Screen Capture', resized_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

text = pytesseract.image_to_string(resized_img)
return text

capture_screen_and_read_text()
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79035241/pytesseract-ocr-not-detecting-numbers-with-less-than-3-digits[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pytesseract OCR не обнаруживает числа длиной менее 3 цифр

Последнее сообщение Anonymous « 29 сен 2024, 10:27
Добавлено в форуме Python

Anonymous » 29 сен 2024, 10:27 » в форуме Python

У меня есть скрипт Python, который захватывает сегмент экрана, считывает его текстовое значение и преобразует текст только в числовые символы, возвращая его. Моя проблема в том, что pytesseract читает только числа, цифры которых равны 3 или больше,...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
29 сен 2024, 10:27
Pytesseract OCR не обнаруживает числа длиной менее 3 цифр

Последнее сообщение Anonymous « 08 окт 2024, 18:04
Добавлено в форуме Python

Anonymous » 08 окт 2024, 18:04 » в форуме Python

У меня есть скрипт Python, который захватывает сегмент экрана, считывает его текстовое значение и преобразует текст только в числовые символы, возвращая его. Моя проблема в том, что pytesseract читает только числа, цифры которых равны 3 или больше,...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
08 окт 2024, 18:04
Обнаружить текст в формате «числовая единица», используя pytesseract OCR ValueError при преобразовании числа в число с п

Последнее сообщение Anonymous « 16 сен 2024, 10:49
Добавлено в форуме Python

Anonymous » 16 сен 2024, 10:49 » в форуме Python

Это из завершившегося онлайн-хакатона (извлечение значений сущностей объектов из изображений). Я новичок, но сначала попробовал создать функцию ocr для извлечения текста из предварительно обработанных изображений и передачи его через Функция...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 10:49
Обнаружить текст в формате «числовая единица», используя pytesseract OCR ValueError при преобразовании числа в число с п

Последнее сообщение Anonymous « 16 сен 2024, 13:55
Добавлено в форуме Python

Anonymous » 16 сен 2024, 13:55 » в форуме Python

Это из завершившегося онлайн-хакатона (извлечение значений сущностей объектов из изображений). Я новичок, но сначала попробовал создать функцию ocr для извлечения текста из предварительно обработанных изображений и передачи его через Функция...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 13:55
Вывод тарабарщины для PyTesseract OCR

Последнее сообщение Anonymous « 21 май 2024, 06:14
Добавлено в форуме Python

Anonymous » 21 май 2024, 06:14 » в форуме Python

pytesseract.pytesseract.tesseract_cmd = C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe
def extract_text(image):
gray = image.convert('L')
enhancer = ImageEnhance.Contrast(gray)
enhanced_image = enhancer.enhance(2)
enhanced_image =...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
21 май 2024, 06:14

Вернуться в «Python»