PyMuPDF - запретить автоматическое обрезание PDF-страниц [закрыто]

PyMuPDF - запретить автоматическое обрезание PDF-страниц [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

PyMuPDF - запретить автоматическое обрезание PDF-страниц [закрыто]

Цитата

Сообщение Anonymous » 08 янв 2025, 19:32

Я использую PyMuPDF для обработки PDF-файла и последующего его повторного сохранения, но полученный файл теряет исходную ориентацию страницы и рамки обрезки. Некоторые страницы исходного PDF-файла больше или имеют различную ориентацию (например, повернуты или имеют пользовательские области обрезки), но после вызова pdf.save() все страницы становятся одинакового размера и ориентации.
Пример:
import pymupdf
pdf = pymupdf.open(pdf_path, filetype="pdf")
pdf.save("pymupdf-exported.pdf")

Исходный файл: https://static.vitra.com/media/asset/86 ... 024-EN.pdf
Экспортированный PDF: https://drive.google.com/file/d/1mVzAoS ... sp=sharing
Как сохранить исходную ориентацию страницы и поля обрезки при использовании PyMuPDF, чтобы повторно сохраненный PDF-файл соответствует исходному макету?
Моя конечная цель:
def convert_pdf_to_image_arrays(pdf_path: str, zoom: int, dpi: int) -> list[np.ndarray]:
"""
Convert a PDF to high-resolution image arrays, preserving color fidelity.

:param pdf_path: Path to the PDF file.
:param dpi: DPI (dots per inch) for rendering high-resolution images.
:return: List of NumPy arrays representing images of the PDF pages.
"""
pdf = pymupdf.open(pdf_path, filetype="pdf")
images: list[np.ndarray] = []
for page in pdf:
# Render the page to a pixmap with the desired DPI
pix = page.get_pixmap(dpi=dpi)
# Convert the raw pixel data to a PIL image (preserving color accuracy)
img_pil = Image.frombytes(
mode="RGB" if pix.n == 3 else "RGBA",
size=(pix.width, pix.height),
data=pix.samples,
)
# Convert the PIL image to a NumPy array
img_array = np.array(img_pil)
# Convert RGBA to BGR if the image has an alpha channel
if pix.n == 4:
img_array = cv2.cvtColor(img_array, cv2.COLOR_RGBA2BGR)
else:
img_array = cv2.cvtColor(img_array, cv2.COLOR_RGB2BGR)
images.append(img_array)
pdf.close()
return images

Изменить: я попробовал распечатать рамку обрезки всех страниц.
pdf = pymupdf.open(pdf_path, filetype="pdf")
images: list[np.ndarray] = []
for page in pdf:
print(f"Cropbox {page.number}: {page.cropbox}")

Вывод:
Cropbox 0: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 1: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 2: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 3: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 4: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 5: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 6: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 7: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 8: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 9: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 10: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 11: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 12: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 13: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 14: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 15: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 16: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 17: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 18: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 19: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 20: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 21: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 22: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 23: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 24: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 25: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 26: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 27: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 28: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 29: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 30: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 31: Rect(0.0, 0.0, 612.0, 792.0)

Подробнее здесь: https://stackoverflow.com/questions/792 ... to-cropped

1736353973

Anonymous

Я использую PyMuPDF для обработки PDF-файла и последующего его повторного сохранения, но полученный файл теряет исходную ориентацию страницы и рамки обрезки. Некоторые страницы исходного PDF-файла больше или имеют различную ориентацию (например, повернуты или имеют пользовательские области обрезки), но после вызова pdf.save() все страницы становятся одинакового размера и ориентации.
[b]Пример:[/b]
import pymupdf
pdf = pymupdf.open(pdf_path, filetype="pdf")
pdf.save("pymupdf-exported.pdf")

Исходный файл: https://static.vitra.com/media/asset/8664580/storage/master/download/Factbook%2520Electrification%25202024-EN.pdf
Экспортированный PDF: https://drive.google.com/file/d/1mVzAoS8OWHHRyM2X_BDABoCCaxAAnrL1x/view?usp=sharing
Как сохранить исходную ориентацию страницы и поля обрезки при использовании PyMuPDF, чтобы повторно сохраненный PDF-файл соответствует исходному макету?
Моя конечная цель:
def convert_pdf_to_image_arrays(pdf_path: str, zoom: int, dpi: int) -> list[np.ndarray]:
"""
Convert a PDF to high-resolution image arrays, preserving color fidelity.

:param pdf_path: Path to the PDF file.
:param dpi: DPI (dots per inch) for rendering high-resolution images.
:return: List of NumPy arrays representing images of the PDF pages.
"""
pdf = pymupdf.open(pdf_path, filetype="pdf")
images: list[np.ndarray] = []
for page in pdf:
# Render the page to a pixmap with the desired DPI
pix = page.get_pixmap(dpi=dpi)
# Convert the raw pixel data to a PIL image (preserving color accuracy)
img_pil = Image.frombytes(
mode="RGB" if pix.n == 3 else "RGBA",
size=(pix.width, pix.height),
data=pix.samples,
)
# Convert the PIL image to a NumPy array
img_array = np.array(img_pil)
# Convert RGBA to BGR if the image has an alpha channel
if pix.n == 4:
img_array = cv2.cvtColor(img_array, cv2.COLOR_RGBA2BGR)
else:
img_array = cv2.cvtColor(img_array, cv2.COLOR_RGB2BGR)
images.append(img_array)
pdf.close()
return images

Изменить: я попробовал распечатать рамку обрезки всех страниц.
pdf = pymupdf.open(pdf_path, filetype="pdf")
images: list[np.ndarray] = []
for page in pdf:
print(f"Cropbox {page.number}: {page.cropbox}")

Вывод:
Cropbox 0: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 1: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 2: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 3: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 4: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 5: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 6: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 7: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 8: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 9: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 10: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 11: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 12: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 13: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 14: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 15: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 16: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 17: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 18: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 19: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 20: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 21: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 22: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 23: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 24: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 25: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 26: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 27: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 28: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 29: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 30: Rect(0.0, 0.0, 612.0, 792.0)
Cropbox 31: Rect(0.0, 0.0, 612.0, 792.0)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79260810/pymupdf-prevent-pdf-pages-from-being-auto-cropped[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Невозможно подсчитать нумерацию страниц в формате PDF. Использование счетчика (страниц) и счетчика (страниц) — это счетч

Последнее сообщение Anonymous « 19 окт 2023, 14:46
Добавлено в форуме CSS

Anonymous » 19 окт 2023, 14:46 » в форуме CSS

У меня есть отчет в формате html, и данные заполняются с использованием скорости Apache . Здесь я добавил нижний колонтитул. В разделе нижнего колонтитула будет показан номер страницы разбивки на страницы, но отображается Страница 0 из 0 > Я не...

0 Ответы

206 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 14:46
Обрезание Qt drawText из-за дополнительного верхнего интервала. Почему для некоторых символов предусмотрен дополнительны

Последнее сообщение Гость « 01 мар 2024, 10:22
Добавлено в форуме C++

Гость » 01 мар 2024, 10:22 » в форуме C++

Я пытаюсь использовать QPainter::drawText() для отрисовки некоторых китайских символов. Но в некоторых шрифтах при рисовании текста имеется дополнительный верхний интервал. Почему это происходит только с некоторыми персонажами?

Протестировано на...

0 Ответы

46 Просмотры

Последнее сообщение Гость
01 мар 2024, 10:22
Как исправить обрезание SVG при использовании в качестве фона?

Последнее сообщение Anonymous « 06 мар 2024, 11:19
Добавлено в форуме CSS

Anonymous » 06 мар 2024, 11:19 » в форуме CSS

I'm currently experiencing an issue with my SVG, where it seems to be cut off when it is resized on a larger screen. I've attempted various adjustments to the preserveAspectRatio attribute without success.

I've explored multiple methods, but none...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
06 мар 2024, 11:19
Случайное обрезание изображения Python CustomTKinter

Последнее сообщение Гость « 17 мар 2024, 12:17
Добавлено в форуме Python

Гость » 17 мар 2024, 12:17 » в форуме Python

Я пытался создать только стартовый экран для игры в крестики-нолики, но столкнулся с проблемой, из-за которой вертикальные изображения случайно обрезали горизонтальные. Проблема возникла только после того, как я ввел горизонтальные полосы. когда...

0 Ответы

21 Просмотры

Последнее сообщение Гость
17 мар 2024, 12:17
Обрезание скрытой части изображения с использованием палата клипа

Последнее сообщение Anonymous « 05 фев 2025, 03:13
Добавлено в форуме CSS

Anonymous » 05 фев 2025, 03:13 » в форуме CSS

Я использую Clip-Path, чтобы обрезать изображение, чтобы сделать его меньшим прямоугольником, чем раньше. Однако коробка, которую я ставлю, относится к нему, как и остальная часть изображения все еще там. Есть ли способ избавиться от избыточной...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
05 фев 2025, 03:13

Вернуться в «Python»