Я пытаюсь получить ограничивающую коробку из всех статей на странице PDF в газете с помощью PDFPLURME. Однако это не отмечает все статьи. Я использую код ниже. < /P>
import pdfplumber
pdf = pdfplumber.open("2.pdf")
p0 = pdf.pages[0]
im = p0.to_image(resolution=150)
table_settings = {
"snap_y_tolerance": 0,
"intersection_x_tolerance": 50,
}
im.debug_tablefinder(table_settings)
tables = p0.find_tables(table_settings)
im.show()
< /code>
Ссылка на обработанное изображение < /p>
Тем не менее, оно не отмечает все статьи, как показано на прикрепленном изображении. Я думаю, что подход к таблицам был самым быстрым и коротким способом, но он работает для хорошо организованных таблиц. Я думаю, что эта стратегия не подходит для газетных статей. Будут оценены любые другие предложения или улучшения в коде.
Подробнее здесь: https://stackoverflow.com/questions/797 ... r-pdf-file
Получите ограничивающую коробку всех статей в газете PDF -файла ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Python folium.raster_layers.videoOverlay () Видео не заполняет ограничивающую коробку
Anonymous » » в форуме Python - 0 Ответы
- 20 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Рисовать ограничивающую коробку вокруг самого большого контурного питона CV
Anonymous » » в форуме Python - 0 Ответы
- 16 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Рисовать ограничивающую коробку вокруг самого большого контурного питона CV
Anonymous » » в форуме Python - 0 Ответы
- 15 Просмотры
-
Последнее сообщение Anonymous
-