Как ускорить работу pdf2docx?Python

Программы на Python
Ответить
Anonymous
 Как ускорить работу pdf2docx?

Сообщение Anonymous »

Сейчас у меня есть очень простой код, который принимает PDF-файл и превращает его в файл docx по тому же пути и с тем же именем.
Однако преобразование PDF-файлов большего размера, превышающих 100 страниц, занимает больше минуты. Это должно быть меньше минуты. Сам мой код выполняется менее чем за секунду.
Мне нравится pdf2docx, потому что он включает в себя все форматирование, таблицы, цвета и т. д., а это то, что мне нужно. Но если у кого-то есть другие предложения, дайте мне знать.
Минимальный воспроизводимый пример (вам понадобится собственный документ):
def pdf_to_word(pdf_path, docx_path):
"""Uses pdf2docx Converted to turn a pdf into word,
because word is way easier to decode into an xml."""

cv = Converter(pdf_path)
cv.convert(docx_path, start=0, end=None)
cv.close()

pdf_to_word("example.pdf", "example.docx")



Подробнее здесь: https://stackoverflow.com/questions/798 ... p-pdf2docx
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»