Извлечение пары ключ-значение с помощью OCRPython

Программы на Python
Ответить
Anonymous
 Извлечение пары ключ-значение с помощью OCR

Сообщение Anonymous »

Я пытаюсь извлечь пары ключевых значений, например: - (ценные бумаги-акции: 0,00), используя pytesseract из изображения отчета о личных финансах. например,
Изображение

Но пока я не могу этого получить,
Как мне исправить свой подход, чтобы извлечь пару ключ-значение из изображения?
До сих пор мне удавалось извлечь только текст и его координаты
import pytesseract
import cv2
import numpy as np
from PIL import ImageTk, Image

pytesseract.pytesseract.tesseract_cmd = r'path to tesseract' #your path to tesseract engine
extracted = (pytesseract.image_to_data(Image.open('image.png'),lang='eng', output_type='data.frame'))
res = []
extracted = extracted.replace(r'^\s*$', np.nan, regex=True)
extracted = extracted.dropna()
image_data = extracted.to_numpy().tolist()
res.append({'image_data': image_data})
print(res)


Подробнее здесь: https://stackoverflow.com/questions/742 ... -using-ocr
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»