Как повысить точность чтения текста на изображениях с помощью Microsoft Azure Computer Vision AIPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как повысить точность чтения текста на изображениях с помощью Microsoft Azure Computer Vision AI

Сообщение Anonymous »

Я новичок в Microsoft Azure AI Computer Vision. Я использую Cognitive Services и клиент компьютерного зрения в программе Python, чтобы сделать две вещи:
  • извлечь текст из изображения JPG с помощью оптического распознавания символов (OCR).
  • Используйте Cognitive Services для предоставления описания изображения.
После множества проблем с настройкой (и установкой PIP! ), я добился НЕКОТОРЫХ результатов
Код для извлечения текста из изображения:

Код: Выделить всё

#Create A ComputerVision Client
client = ComputerVisionClient(ENDPOINT, CognitiveServicesCredentials(API_KEY))

image_path = '/Users/Owner/Documents/Bills Stuff/eBay/Images/Document_20240914_0008.jpg'

#Use Azure AI Cognitive Services to Get the Title and Description of Image
#For the TITLE, Use Optical Character Recognition (OCR) to Read the Text (Caption) on the Image
with open(image_path, "rb") as image_stream:
ocr_results=client.recognize_printed_text_in_stream(image_stream)

if ocr_results.regions:
for region in ocr_results.regions:
for line in region.lines:
print(f"   Title: {' '.join([word.text for word in line.words])}")
Второй момент: описание работает отлично, НО приведенный выше код совершенно не точно извлекает текст из изображения.
Это ЗАКРЫТО , но фактический текст: «Живописный вид на подкову кривой на Пенсильванской железной дороге».
Код, который я представил выше, возвращает: «Внутри подковообразной кривой на китайской железной дороге»Есть ли способ улучшить мой код, чтобы сделать этот результат более точным?
Добавление: если я уменьшу/увеличу размер изображения, код поднимется больше или меньше слов - может надо как-то дать коду больше времени на обработку изображения??
Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/789 ... computer-v
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»