Я создал новый одностраничный PDF-файл размером около 132 КБ и простая тестовая программа. Длина текста выглядит правильно, но выходной PDF-файл снова имеет размер всего 311 байт.
Код: Выделить всё
from pypdf import PdfReader, PdfWriter
input_pdf = PdfReader('testpdf.pdf')
page = input_pdf.pages[0]
print(len(page.extract_text()))
output = PdfWriter()
output.add_page = page
with open('testpdf_1.pdf', 'wb') as output_stream:
output.write(output_stream)
Код: Выделить всё
False, )
Я использую pypdf 5.0.1 и python 3.8.0 в венве.
Подробнее здесь: https://stackoverflow.com/questions/791 ... -any-pages