например:
- Клиент хочет отфильтровать свой PDF-файл (Интерфейс будет похож на веб-сайт IlovePdf)< /li>
Он щелкает загрузить файл - Затем выбирает, с какой страницы он хочет фильтровать (например, с 1 по 13, с 14 по 20, с 21 по 25)
< li>Затем в папку будут загружаться новые отфильтрованные файлы.
Все это будет похоже на приложение в компьютеры, поэтому мне нужно будет создать интерфейс, который я сделаю самостоятельно (по крайней мере, я попытаюсь это сделать)
Я пытался использовать glob и мне это не помогло, затем я установил venv в мой проект Python и все
Код: Выделить всё
import glob, os
folder_path = 'C:\\work\\PythonPDF'
os.chdir(folder_path)
files = [file for file in glob.glob("*.pdf")]
files = [file for file in files if file.__contains__('Conlclusion')]
print(files)
Код: Выделить всё
import fitz
def extract_pdfs(input_pdf_path, output_dir):
document = fitz.open(input_pdf_path)
pdf_count = 1
new_pdf = fitz.open()
for i in range(document.page_count):
page = document.load_page(i)
page_text = page.get_text("text")
if "Abstract" in page_text:
if new_pdf.page_count > 0:
new_pdf.save(f"{output_dir}/extracted_pdf_{pdf_count}.pdf")
pdf_count += 1
new_pdf = fitz.open()
new_pdf.insert_pdf(document, from_page=i, to_page=i)
if new_pdf.page_count > 0:
new_pdf.save(f"{output_dir}/extracted_pdf_{pdf_count}.pdf")
print(f"Извлечено {pdf_count} отдельных PDF файлов.")
input_pdf = r"C:\work\PythonPDF\Filter.pdf"
output_directory = r"C:\work\PythonPDF\AllPdf"
extract_pdfs(input_pdf, output_directory)
Спасибо!
Подробнее здесь: https://stackoverflow.com/questions/791 ... ith-python
Мобильная версия