Неструктурированный, не могу найти изображенияPython

Программы на Python
Ответить
Anonymous
 Неструктурированный, не могу найти изображения

Сообщение Anonymous »

Я пытаюсь использовать неструктурированную библиотеку для преобразования документа Word в файл JSON. Однако по какой-то причине он не видит изображений; в списке возвращаемых элементов должны быть элементы типа «Изображение». Он не выдает ошибку, он просто не возвращает элементы изображения. Ниже моего кода и моего тестового файла. Тестовый файл содержит строку, изображение и еще одну строку. Но изображение при этом не обнаруживается. Что я делаю не так?

Код: Выделить всё

from unstructured.partition.docx import partition_docx
import os
# Set environment variables
os.environ['UNSTRUCTURED_API_KEY'] = "your unstructured.io api key"
os.environ['UNSTRUCTURED_API_URL'] = "https://api.unstructuredapp.io/general/v0/general"

elements = partition_docx(filename="input/test.docx")

with open("input/test.docx", "rb") as f:
elements = partition_docx(file=f)
elements = [element.to_dict() for element in elements]
# save as json
with open("output/test.json", "w") as f_json:
json.dump(elements, f_json, indent=2)
Структура моего проекта:

Код: Выделить всё

├── root
│   └── input
│   └── output
Вот файл: test.docx

Подробнее здесь: https://stackoverflow.com/questions/792 ... ind-images
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»