Код: Выделить всё
pymupdfПохоже, что класс Converter в pdf2docx имеет действительно надежные конфигурации, которые позволяют ему получать все таблицы и очень четко их читать. Единственная проблема заключается в том, что иногда он заменяет то, что, как я думаю, считает вложенной таблицей, на строку. Я обнаружил эту проблему и успешно воспроизвел исправление на своем локальном компьютере, отредактировав класс Cell в файле Cell.py в каталоге таблиц pdf2docx. Однако я хотел бы иметь возможность использовать это в облачной функции в GCP без загрузки исходного кода в облачную функцию в виде прямых файлов. Есть ли способ установить pdf2docx через мой файл require.txt, а затем в самом коде переопределить метод Cell.text?
Подробнее здесь: https://stackoverflow.com/questions/791 ... rted-class
Мобильная версия