Я использую
pythn-docx (
https://github.com/python-openxml/python-docx), чтобы сгенерировать файл docx, а затем преобразовать этот файл docx в формат PDF с использованием UnoConv (
https://github.com/unoconv/unoconv), все работает нормально, за исключением содержимого списка цифр и таблиц в PDF, списки появляются правильными, но это не кликабельно. фигур и таблиц, затем извлекли XML из этого файла Word и найдите XML подписей и таблиц, цифры. и тот же XML, который использовался для генерации DOCX в Python . Я использую от docx.oxml.shared import oxmlelement для генерации XML, который понимает фигуры Microsoft Word и MS Word, которые выпускают, когда вы открываете документ, и автоматически заполняют добавленный XML на основе данных.
Подход к Covert Docx к PDF: я использую
unoconv python package для covert docx в pdf, Unoconv использует LibreOffice для преобразования DOCX в PDF
Примечание: я открыл один и тот же файл DOC в MS Word и LibreOffice Word, в обоих программном плане списка цифр и таблиц Нажмите на клик и способны перейти на страницу на щелчке. В идеале он должен работать и в PDF, но не работать. p>
Код: Выделить всё
Table
SEQ Table \* ARABIC # for figure: SEQ Figure \* ARABIC
Test
< /code>
, а затем создание списка рисунков и таблиц с использованием xml: < /p>
Таблица: < /p>
TOC \h \z \c "Table"
Right-click to update field
< /code>
Рисунки: < /p>
TOC \h \z \c "Figure"
Right-click to update field
Я думаю, что в XML мне не хватает, что LibreOffice, необходимый для того, чтобы сделать кликабель в PDF, помогите очень важно, спасибо заранее.
Подробнее здесь:
https://stackoverflow.com/questions/794 ... df-while-c