Как повысить точность чтения текста на изображениях с помощью Microsoft Azure Computer Vision AI

Как повысить точность чтения текста на изображениях с помощью Microsoft Azure Computer Vision AI ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как повысить точность чтения текста на изображениях с помощью Microsoft Azure Computer Vision AI

Цитата

Сообщение Anonymous » 16 сен 2024, 23:32

Я новичок в Microsoft Azure AI Computer Vision. Я использую Cognitive Services и клиент компьютерного зрения в программе Python, чтобы сделать две вещи:

извлечь текст из изображения JPG с помощью оптического распознавания символов (OCR).
Используйте Cognitive Services для предоставления описания изображения.

После множества проблем с настройкой (и установкой PIP! ), я добился НЕКОТОРЫХ результатов
Код для извлечения текста из изображения:

Код: Выделить всё

#Create A ComputerVision Client
client = ComputerVisionClient(ENDPOINT, CognitiveServicesCredentials(API_KEY))

image_path = '/Users/Owner/Documents/Bills Stuff/eBay/Images/Document_20240914_0008.jpg'

#Use Azure AI Cognitive Services to Get the Title and Description of Image
#For the TITLE, Use Optical Character Recognition (OCR) to Read the Text (Caption) on the Image
with open(image_path, "rb") as image_stream:
ocr_results=client.recognize_printed_text_in_stream(image_stream)

if ocr_results.regions:
for region in ocr_results.regions:
for line in region.lines:
print(f"   Title: {' '.join([word.text for word in line.words])}")

Второй момент: описание работает отлично, НО приведенный выше код совершенно не точно извлекает текст из изображения.
Это ЗАКРЫТО , но фактический текст: «Живописный вид на подкову кривой на Пенсильванской железной дороге».
Код, который я представил выше, возвращает: «Внутри подковообразной кривой на китайской железной дороге»Есть ли способ улучшить мой код, чтобы сделать этот результат более точным?
Добавление: если я уменьшу/увеличу размер изображения, код поднимется больше или меньше слов - может надо как-то дать коду больше времени на обработку изображения??
Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/789 ... computer-v

1726518769

Anonymous

Я новичок в Microsoft Azure AI Computer Vision. Я использую Cognitive Services и клиент компьютерного зрения в программе Python, чтобы сделать две вещи:
[list]
[*]извлечь текст из изображения JPG с помощью оптического распознавания символов (OCR).
[*]Используйте Cognitive Services для предоставления описания изображения.
[/list]
После множества проблем с настройкой (и установкой PIP! ), я добился НЕКОТОРЫХ результатов
Код для извлечения текста из изображения:
[code]#Create A ComputerVision Client
client = ComputerVisionClient(ENDPOINT, CognitiveServicesCredentials(API_KEY))

image_path = '/Users/Owner/Documents/Bills Stuff/eBay/Images/Document_20240914_0008.jpg'

#Use Azure AI Cognitive Services to Get the Title and Description of Image
#For the TITLE, Use Optical Character Recognition (OCR) to Read the Text (Caption) on the Image
with open(image_path, "rb") as image_stream:
ocr_results=client.recognize_printed_text_in_stream(image_stream)

if ocr_results.regions:
for region in ocr_results.regions:
for line in region.lines:
print(f"   Title: {' '.join([word.text for word in line.words])}")
[/code]
Второй момент: описание работает отлично, НО приведенный выше код совершенно не точно извлекает текст из изображения.
Это ЗАКРЫТО , но фактический текст: «Живописный вид на подкову кривой на Пенсильванской железной дороге».
Код, который я представил выше, возвращает: «Внутри подковообразной кривой на китайской железной дороге»Есть ли способ улучшить мой код, чтобы сделать этот результат более точным?
Добавление: если я уменьшу/увеличу размер изображения, код поднимется больше или меньше слов - может надо как-то дать коду больше времени на обработку изображения??
Спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/78991568/how-to-increase-accuracy-of-text-read-in-images-using-microsoft-azure-computer-v[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как повысить точность чтения текста на изображениях с помощью Microsoft Azure Computer Vision AI

Последнее сообщение Anonymous « 17 сен 2024, 04:25
Добавлено в форуме Python

Anonymous » 17 сен 2024, 04:25 » в форуме Python

Я новичок в Microsoft Azure AI Computer Vision. Я использую Cognitive Services и клиент компьютерного зрения в программе Python, чтобы сделать две вещи:

извлечь текст из изображения JPG с помощью оптического распознавания символов (OCR)....

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 04:25
Функция st_makeenvelope (двойная точность, двойная точность, двойная точность, двойная точность, целое число) не существ

Последнее сообщение Anonymous « 07 авг 2025, 10:55
Добавлено в форуме JAVA

Anonymous » 07 авг 2025, 10:55 » в форуме JAVA

function st_makeenvelope (двойная точность, двойная точность, двойная точность, двойная точность, целое число) не существует
Подсказка: Никакая функция не соответствует данным имени и типам аргументов. Вам может потребоваться добавить явные типы....

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
07 авг 2025, 10:55
Приглашение становится неудачным в Azure Computer Vision, когда учетная запись хранения является частной [закрыто]

Последнее сообщение Anonymous « 27 янв 2025, 11:49
Добавлено в форуме Python

Anonymous » 27 янв 2025, 11:49 » в форуме Python

В настоящее время сталкиваюсь с проблемой с доступом к учетной записи во время приема данных с использованием компьютерного зрения. Проблема возникает, когда учетная запись хранения установлена на частную. Однако, когда учетная запись хранения...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 11:49
Приглашение становится неудачным в Azure Computer Vision, когда учетная запись хранения является частной [закрыто]

Последнее сообщение Anonymous « 27 янв 2025, 12:54
Добавлено в форуме Python

Anonymous » 27 янв 2025, 12:54 » в форуме Python

В настоящее время сталкиваюсь с проблемой с доступом к учетной записи во время приема данных с использованием компьютерного зрения. Проблема возникает, когда учетная запись хранения установлена на частную. Однако, когда учетная запись хранения...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 12:54
Как я могу повысить точность OCR Tesseract на вращаемых изображениях в C ++?

Последнее сообщение Anonymous « 10 апр 2025, 14:18
Добавлено в форуме C++

Anonymous » 10 апр 2025, 14:18 » в форуме C++

Я использую Tesseract ocr (v5.5.0) в C ++, чтобы извлечь текст из изображений, но я сталкиваюсь с проблемами, когда изображения вращаются. Tesseract PSM_Auto_osd ( PageSegMode::PSM_AUTO_OSD ) хорошо работает для прямых изображений, но он не...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
10 апр 2025, 14:18

Вернуться в «Python»