Перезаписать свойство в используемом (но не импортированном) классе.

Перезаписать свойство в используемом (но не импортированном) классе. ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Перезаписать свойство в используемом (но не импортированном) классе.

Цитата

Сообщение Anonymous » 14 ноя 2024, 18:31

Я использую fitz/

Код: Выделить всё

pymupdf

и pdf2docx пакеты Python для чтения таблиц из файлов PDF, чтобы я мог извлекать из них данные и моделировать их соответствующим образом для хранения в озере данных.
Похоже, что класс Converter в pdf2docx имеет действительно надежные конфигурации, которые позволяют ему получать все таблицы и очень четко их читать. Единственная проблема заключается в том, что иногда он заменяет то, что, как я думаю, считает вложенной таблицей, на строку. Я обнаружил эту проблему и успешно воспроизвел исправление на своем локальном компьютере, отредактировав класс Cell в файле Cell.py в каталоге таблиц pdf2docx. Однако я хотел бы иметь возможность использовать это в облачной функции в GCP без загрузки исходного кода в облачную функцию в виде прямых файлов. Есть ли способ установить pdf2docx через мой файл require.txt, а затем в самом коде переопределить метод Cell.text?

Подробнее здесь: https://stackoverflow.com/questions/791 ... rted-class

1731598292

Anonymous

Я использую fitz/[code]pymupdf[/code] и pdf2docx пакеты Python для чтения таблиц из файлов PDF, чтобы я мог извлекать из них данные и моделировать их соответствующим образом для хранения в озере данных.
Похоже, что класс Converter в pdf2docx имеет действительно надежные конфигурации, которые позволяют ему получать все таблицы и очень четко их читать.  Единственная проблема заключается в том, что иногда он заменяет то, что, как я думаю, считает вложенной таблицей, на строку.  Я обнаружил эту проблему и успешно воспроизвел исправление на своем локальном компьютере, отредактировав класс Cell в файле Cell.py в каталоге таблиц pdf2docx.  Однако я хотел бы иметь возможность использовать это в облачной функции в GCP без загрузки исходного кода в облачную функцию в виде прямых файлов.  Есть ли способ установить pdf2docx через мой файл require.txt, а затем в самом коде переопределить метод Cell.text? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79185997/overwrite-a-property-in-a-used-but-not-imported-class[/url]

Ответить

1 сообщение • Страница 1 из 1