Лучшие модели/библиотеки Python для извлечения таблиц из PDF-файловPython

Программы на Python
Ответить
Anonymous
 Лучшие модели/библиотеки Python для извлечения таблиц из PDF-файлов

Сообщение Anonymous »

У меня есть несколько PDF-файлов, из которых я хочу извлечь данные таблицы.
Но проблема в том, что таблица многостраничная, я хочу обнаружить эту многостраничную таблицу и сделать ее единой.
. Кроме того, в одном PDF-файле есть несколько таблиц, поэтому их не следует смешивать.
Привет!
Я я ищу модели, которые могут помочь в извлечении данных таблицы из PDF.
Я попробовал Azure Document Intelligence, но он не дал ожидаемых результатов.
Вот точные требования:
a) Возможность обнаружения нескольких таблицы и иметь возможность присваивать идентификатор каждой таблице для их группировки.
b) Одна таблица может быть многостраничной, поэтому модель должна иметь возможность это обнаружить.
в) Возможность обнаружения всех столбцов таблицы

Подробнее здесь: https://stackoverflow.com/questions/793 ... -from-pdfs
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»