Мне хотелось бы массово отредактировать PDF-файлы, а точнее удалить строку, содержащую символ «X», из всех моих PDF-файлов, но я не могу этого сделать.
мой документ состоит из 3 частей: заголовок с логотипом компании/данными клиента
вторая часть с таблицей, содержащей все операции => именно в этой части есть строка, содержащая символ «X», который я хочу удалите третью часть: нижнюю часть документа.
после этих изменений мне захотелось преобразовать документ обратно в PDF-файл.
У вас есть идеи?
Я пытался использовать Python для преобразования моего PDF-файла в текстовый формат, но последний интерпретировал его очень плохо: ломаные линии и неуместные имена столбцов сделали документ совершенно нечитаемым. => Я хотел сделать это, чтобы затем изменить и удалить нужную мне строку, но если она плохо интерпретируется в txt, это бесполезно
вот код:
from pdfminer.high_level import extract_text def pdf_to_text (pdf_path, txt_path): text = extract_text(pdf_path) with open (txt_path, 'w' , encoding= 'utf-8' ) as txt_file: txt_file.write(text) # Exemple d'utilisation pdf_to_text( 'votre_fichier.pdf' , 'votre_fichier.txt' )
Подробнее здесь: https://stackoverflow.com/questions/787 ... -character
Отредактируйте PDF-файл — удалите строку из PDF-файла, если она содержит символ «X». ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение