Удалите фоновый текст и шум из изображения, используя обработку изображений с помощью OpenCV.

Удалите фоновый текст и шум из изображения, используя обработку изображений с помощью OpenCV. ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Удалите фоновый текст и шум из изображения, используя обработку изображений с помощью OpenCV.

Цитата

Сообщение Anonymous » 17 янв 2025, 13:39

У меня есть эти изображения

Для которого я хочу удалить текст в фон. Должны остаться только символы капчи (т.е. K6PwKA, YabVzu). Задача состоит в том, чтобы позже идентифицировать эти символы с помощью тессеракта.

Это то, что я пробовал, но это не дает большой точности.

Код: Выделить всё

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Users\HPO2KOR\AppData\Local\Tesseract-OCR\tesseract.exe"
img = cv2.imread("untitled.png")
gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray_filtered = cv2.inRange(gray_image, 0, 75)
cv2.imwrite("cleaned.png", gray_filtered)

Как я могу улучшить то же самое?

Примечание:
Я перепробовал все предложения, которые мне предлагали по этому вопросу, и ни одно из них мне не помогло.

РЕДАКТИРОВАТЬ:
Согласно Элиас, я попытался найти цвет текста капчи с помощью фотошопа, преобразовав его в оттенки серого, что оказался где-то посередине [100, 105]. Затем я устанавливаю порог изображения на основе этого диапазона. Но результат, который я получил, не дал удовлетворительного результата от тессеракта.

Код: Выделить всё

gray_filtered = cv2.inRange(gray_image, 100, 105)
cv2.imwrite("cleaned.png", gray_filtered)
gray_inv = ~gray_filtered
cv2.imwrite("cleaned.png", gray_inv)
data = pytesseract.image_to_string(gray_inv, lang='eng')

Вывод:

Код: Выделить всё

'KEP wKA'

Результат:

[img]https://i .sstatic.net/AqYeO.png[/img]

РЕДАКТИРОВАТЬ 2:

Код: Выделить всё

def get_text(img_name):
lower = (100, 100, 100)
upper = (104, 104, 104)
img = cv2.imread(img_name)
img_rgb_inrange = cv2.inRange(img, lower, upper)
neg_rgb_image = ~img_rgb_inrange
cv2.imwrite('neg_img_rgb_inrange.png', neg_rgb_image)
data = pytesseract.image_to_string(neg_rgb_image, lang='eng')
return data

дает:

[img]https://i .sstatic.net/rSrSz.png[/img]

и текст как

Код: Выделить всё

GXuMuUZ

Есть ли способ немного смягчить его?

Подробнее здесь: https://stackoverflow.com/questions/601 ... with-openc

1737110356

Anonymous

У меня есть эти изображения

[img]https://i.sstatic.net/VOfgD.png[/img]


[img]https://i.sstatic.net/TdRKg.png[/img]

Для которого я хочу удалить текст в фон. Должны остаться только символы капчи (т.е. K6PwKA, YabVzu). Задача состоит в том, чтобы позже идентифицировать эти символы с помощью тессеракта.

Это то, что я пробовал, но это не дает большой точности.

[code]import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Users\HPO2KOR\AppData\Local\Tesseract-OCR\tesseract.exe"
img = cv2.imread("untitled.png")
gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray_filtered = cv2.inRange(gray_image, 0, 75)
cv2.imwrite("cleaned.png", gray_filtered)
[/code]

Как я могу улучшить то же самое?

[b]Примечание:[/b]
Я перепробовал все предложения, которые мне предлагали по этому вопросу, и ни одно из них мне не помогло.

[b]РЕДАКТИРОВАТЬ:[/b]
Согласно Элиас, я попытался найти цвет текста капчи с помощью фотошопа, преобразовав его в оттенки серого, что оказался где-то посередине [100, 105]. Затем я устанавливаю порог изображения на основе этого диапазона. Но результат, который я получил, не дал удовлетворительного результата от тессеракта.

[code]gray_filtered = cv2.inRange(gray_image, 100, 105)
cv2.imwrite("cleaned.png", gray_filtered)
gray_inv = ~gray_filtered
cv2.imwrite("cleaned.png", gray_inv)
data = pytesseract.image_to_string(gray_inv, lang='eng')
[/code]

Вывод:

[code]'KEP wKA'
[/code]

Результат: 

[img]https://i .sstatic.net/AqYeO.png[/img]


[b]РЕДАКТИРОВАТЬ 2:[/b]

[code]def get_text(img_name):
lower = (100, 100, 100)
upper = (104, 104, 104)
img = cv2.imread(img_name)
img_rgb_inrange = cv2.inRange(img, lower, upper)
neg_rgb_image = ~img_rgb_inrange
cv2.imwrite('neg_img_rgb_inrange.png', neg_rgb_image)
data = pytesseract.image_to_string(neg_rgb_image, lang='eng')
return data
[/code]

дает: 

[img]https://i .sstatic.net/rSrSz.png[/img]


и текст как

[code]GXuMuUZ
[/code]

Есть ли способ немного смягчить его? 

Подробнее здесь: [url]https://stackoverflow.com/questions/60145306/remove-background-text-and-noise-from-an-image-using-image-processing-with-openc[/url]