Решение Python для извлечения всех таблиц в формате PDF и сохранения каждой таблицы на отдельном листе Excel.Python

Программы на Python
Ответить
Anonymous
 Решение Python для извлечения всех таблиц в формате PDF и сохранения каждой таблицы на отдельном листе Excel.

Сообщение Anonymous »

Я работаю с несколькими файлами PDF (все на английском языке, в основном в цифровом формате). Каждый PDF-файл содержит несколько таблиц. У некоторых есть 5 таблиц, у других 10–20 таблиц, разбросанных по разным страницам.
Мне нужен надежный способ на Python (или любой другой инструмент), который может автоматически:
  • Открывать каждый PDF-файл
  • Правильно обнаруживать и извлекать ВСЕ таблицы (включая таблицы, занимающие несколько страниц)
  • Сохранять каждую таблицу в Excel, желательно одна таблица на лист (или одна таблица на файл)
Кто-нибудь знает лучшее рабочее решение для такого рода массового извлечения таблиц? Я ищу что-то, что «просто работает» с высокой точностью.
Любые примеры рабочего кода, репозитории GitHub или рекомендации спасут мне жизнь прямо сейчас!
Огромное спасибо! 🙏

Подробнее здесь: https://stackoverflow.com/questions/798 ... -own-excel
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»