Pytesseract преобразует изображение в текст

Pytesseract преобразует изображение в текст ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Pytesseract преобразует изображение в текст

Цитата

Сообщение Anonymous » 26 дек 2024, 16:03

Я пытаюсь использовать pytesseract для извлечения чисел из изображений.
Это работает для некоторых из них (1, 2, 3, 5, 6, 20.. .), но мне бы хотелось, чтобы это работало для всех из них.
Вот образец данных, которые я использую:

[img]https://i.sstatic. net/8AicFUTK.png[/img]

Изображения очень маленькие (75x26), шрифт довольно плохой, но явно читаемый человеком.< /p>
Я попытался выполнить некоторую предварительную обработку, потому что в этом случае она не обнаруживает многого, но даже при предварительной обработке у меня возникают проблемы с обнаружением таких чисел, как 7, 11, 415...Я проверил много всего, но вот версия, которая определяет большую часть моих чисел:

Код: Выделить всё

from PIL import Image, ImageEnhance

image = Image.open(f"{i}.png")
gray = image.convert("L")
enhancer = ImageEnhance.Contrast(gray)
image_enhanced = enhancer.enhance(2.0)
text = pytesseract.image_to_string(image_enhanced, config="--psm 6 -c tessedit_char_whitelist=0123456789")
print(text)

Я также пытался применить пороговое значение с помощью cv2, но без особого успеха, несмотря на то, что иногда числа кажутся более чистыми (1 не найден, найден 0 для 11, 3 для 9... )

Код: Выделить всё

img = cv2.imread(f'/content/{i}.png')
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
_, thresh = cv2.threshold(gray, 170, 255, cv2.THRESH_BINARY)
text = pytesseract.image_to_string(thresh, config="--psm 6 -c tessedit_char_whitelist=0123456789")

Есть ли еще шаги предварительной обработки, которые мне следует добавить, чтобы получить лучшие результаты?
Я знаю, что могу «тонко настроить» pytesseract но это похоже на базовую вещь, поэтому мне было интересно, не делаю ли я это как-то неправильно, прежде чем терять больше времени...

Подробнее здесь: https://stackoverflow.com/questions/793 ... ge-to-text

1735218199

Anonymous

Я пытаюсь использовать pytesseract для извлечения чисел из изображений.
Это работает для некоторых из них (1, 2, 3, 5, 6, 20.. .), но мне бы хотелось, чтобы это работало для всех из них.
Вот образец данных, которые я использую:
[img]https://i.sstatic.net/APKHyn8J.png[/img]

[img]https://i.sstatic. net/8AicFUTK.png[/img]

[img]https://i.sstatic.net/9nc7wA3K.png[/img]

Изображения очень маленькие (75x26), шрифт довольно плохой, но явно читаемый человеком.< /p>
Я попытался выполнить некоторую предварительную обработку, потому что в этом случае она не обнаруживает многого, но даже при предварительной обработке у меня возникают проблемы с обнаружением таких чисел, как 7, 11, 415...Я проверил много всего, но вот версия, которая определяет большую часть моих чисел:
[code]from PIL import Image, ImageEnhance

image = Image.open(f"{i}.png")
gray = image.convert("L")
enhancer = ImageEnhance.Contrast(gray)
image_enhanced = enhancer.enhance(2.0)
text = pytesseract.image_to_string(image_enhanced, config="--psm 6 -c tessedit_char_whitelist=0123456789")
print(text)
[/code]
Я также пытался применить пороговое значение с помощью cv2, но без особого успеха, несмотря на то, что иногда числа кажутся более чистыми (1 не найден, найден 0 для 11, 3 для 9... )
[img]https://i.sstatic.net/rUfyF8ik.png[/img]

[img]https://i.sstatic.net/XVS0SMcg.png[/img]

[img]https://i.sstatic.net/TM3FZrzJ.png[/img]

[code]img = cv2.imread(f'/content/{i}.png')
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
_, thresh = cv2.threshold(gray, 170, 255, cv2.THRESH_BINARY)
text = pytesseract.image_to_string(thresh, config="--psm 6 -c tessedit_char_whitelist=0123456789")
[/code]
Есть ли еще шаги предварительной обработки, которые мне следует добавить, чтобы получить лучшие результаты?
Я знаю, что могу «тонко настроить» pytesseract но это похоже на базовую вещь, поэтому мне было интересно, не делаю ли я это как-то неправильно, прежде чем терять больше времени... 

Подробнее здесь: [url]https://stackoverflow.com/questions/79308558/pytesseract-numbers-image-to-text[/url]