- извлечь текст из изображения JPG с помощью оптического распознавания символов (OCR).
- Используйте Cognitive Services для предоставления описания изображения.
Код для извлечения текста из изображения:
Код: Выделить всё
#Create A ComputerVision Client
client = ComputerVisionClient(ENDPOINT, CognitiveServicesCredentials(API_KEY))
image_path = '/Users/Owner/Documents/Bills Stuff/eBay/Images/Document_20240914_0008.jpg'
#Use Azure AI Cognitive Services to Get the Title and Description of Image
#For the TITLE, Use Optical Character Recognition (OCR) to Read the Text (Caption) on the Image
with open(image_path, "rb") as image_stream:
ocr_results=client.recognize_printed_text_in_stream(image_stream)
if ocr_results.regions:
for region in ocr_results.regions:
for line in region.lines:
print(f" Title: {' '.join([word.text for word in line.words])}")
Это ЗАКРЫТО , но фактический текст: «Живописный вид на подкову кривой на Пенсильванской железной дороге».
Код, который я представил выше, возвращает: «Внутри подковообразной кривой на китайской железной дороге»Есть ли способ улучшить мой код, чтобы сделать этот результат более точным?
Добавление: если я уменьшу/увеличу размер изображения, код поднимется больше или меньше слов - может надо как-то дать коду больше времени на обработку изображения??
Спасибо!
Подробнее здесь: https://stackoverflow.com/questions/789 ... computer-v