У меня есть учетная запись хранения с хранилищем контейнеров Azure, состоящая из нескольких файлов pdf/word/excel. Я хотел бы использовать Azure Document Intelligence для семантической разбивки этих файлов.
Есть ли возможность загрузить файлы непосредственно из хранилища контейнеров в Azure Document Intelligence с помощью langchain? Согласно документации langchain, похоже, что либо файл должен быть доступен локально, либо необходимо передать общедоступный URL-адрес.
Попытка:
# Prerequisite: An Azure AI Document Intelligence resource in one of the 3 preview regions: East US, West US2, West Europe
import os
from langchain_community.document_loaders import AzureAIDocumentIntelligenceLoader
file_path = "storage-path-to-file"
endpoint = os.getenv("DOCUMENTINTELLIGENCE_ENDPOINT")
key = os.getenv("DOCUMENTINTELLIGENCE_API_KEY")
loader = AzureAIDocumentIntelligenceLoader(
api_endpoint=endpoint, api_key=key, file_path=file_path, api_model="prebuilt-layout"
)
documents = loader.load()
# Returns:
# Message: Invalid request.
# Inner error: {
# "code": "InvalidManagedIdentity",
# "message": "The managed identity configuration is invalid: Managed identity is not enabled # for the current resource."
# }
Подробнее здесь: https://stackoverflow.com/questions/787 ... ure-contai
Возможность загрузки документов с помощью Azure Document Intelligence из хранилища контейнеров Azure. ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Azure Document Intelligence (formrecouncer) — «InvalidContent» при передаче PDF-файла
Anonymous » » в форуме Python - 0 Ответы
- 24 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Azure Document Intelligence (formrecouncer) — «InvalidContent» при передаче PDF-файла
Anonymous » » в форуме Python - 0 Ответы
- 12 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Azure Document Intelligence (formrecouncer) — «InvalidContent» при передаче PDF-файла
Anonymous » » в форуме Python - 0 Ответы
- 15 Просмотры
-
Последнее сообщение Anonymous
-