На изображении мы смогли идентифицировать капчу "w5779", но в лучшем случае у меня был результат используя Tesseract, я получил в результате только «w-».
Я пробовал несколько разных подходов, основанных на методах обработки изображений, чтобы минимизировать шумы царапанья, но они не сработали. Ниже приведены некоторые методы, которые я пробовал:
Код: Выделить всё
captcha_image = Image.open(captcha_image_path)
captcha_image_cv = np.array(captcha_image)
gray_image = cv2.cvtColor(captcha_image_cv, cv2.COLOR_BGR2GRAY)
threshold_image = cv2.adaptiveThreshold(gray_image, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
cv2.THRESH_BINARY_INV, 11, 2)
denoised_image = cv2.medianBlur(threshold_image, 3)
dilated_image = cv2.dilate(denoised_image, None, iterations=1)
processed_image = Image.fromarray(dilated_image)
captcha_text = pytesseract.image_to_string(processed_image, config="--psm 8")
Обязательно: это только для обучения, поэтому я стараюсь избегать платных решения для решения капчи (например, 2captcha и т. д.).
Подробнее здесь: https://stackoverflow.com/questions/792 ... -noises-bg