Playwright Python: PDF рендерирует на новой вкладке (200 приложение/PDF), но я не могу его сохранить - как захватить вст

Playwright Python: PDF рендерирует на новой вкладке (200 приложение/PDF), но я не могу его сохранить - как захватить вст ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Playwright Python: PDF рендерирует на новой вкладке (200 приложение/PDF), но я не могу его сохранить - как захватить вст

Цитата

Сообщение Anonymous » 01 сен 2025, 23:31

Я автомагирую сайт инспекций округа Пима с драматургом (Python). Поток:

[*] открытые списки: https://publicworks.pima.gov/inspections

Нажмите на ссылку на запись, которая идет на страницу Accela, как:
/>https://aca-prod.accela.com/pima/cap/ca ... ..образной Это открывает новую вкладку на страницу параметров отчета Accela:
https://aca-prod.accela.com/pima/report ... ycode=pima> < /ul>
эта страница затем загружает фактический PDF с: < /strong>

https://aca-prod.accela.com/pima/report ... ycode=pima> в Browser Is Is Is Wise Pdf Render Prender Prender. Мой сетевой журнал также показывает ответ PDF: < /p>

Код: Выделить всё

RESP 200 https://aca-prod.accela.com/PIMA/Report/ShowReport.aspx?Module=Building&reportType=PRINT_PERMIT_SUMMARY_REPORT&reportID=762&agencyCode=PIMA | ct=application/pdf cl=160319
< /code>
… Но мой код никогда не сохраняет байты, это очень расстраивает. CackDownloads = true

не помогает (сервер-это тип контента: приложение/pdf inline, а не вложение). Я попробовал несколько подходов. Тот же результат. < /Li>
< /ul>
Минимальный код, который воспроизводит < /p>

Код: Выделить всё

from pathlib import Path
from playwright.sync_api import sync_playwright

BASE = "https://publicworks.pima.gov/inspections"
DOWNLOADS = Path("downloads"); DOWNLOADS.mkdir(exist_ok=True)

def is_pdf_response(resp):
return ("Report/ShowReport.aspx" in resp.url
and "application/pdf" in (resp.headers.get("content-type","").lower()))

with sync_playwright() as p:
browser = p.chromium.launch(channel="chrome", headless=False)
ctx = browser.new_context(accept_downloads=True)  # inline PDF, so this never fires
page = ctx.new_page()

# (1) Go to listings and click Prev until rows exist (omitted for brevity)
page.goto(BASE)

# (2) Click a record link -> record details page (omitted: selector resolution)
# page.click("a[href*='CapDetail.aspx']")

# (3) Click "View inspection summary" which opens a new tab
with ctx.expect_page() as new_page_info:
page.click("a#ctl00_PlaceHolderMain_lnkPrintSummary")  # link text/ID varies, but this opens the tab
pdf_tab = new_page_info.value

# (4) The parameter page loads, then the PDF URL is fetched by the site.
# Try to catch the actual PDF response:
caught = {"saved": False}

def on_response(resp):
if is_pdf_response(resp):
# Attempt 1: save body() from the response we just saw
content = resp.body()  # 

Подробнее здесь: [url]https://stackoverflow.com/questions/79752888/playwright-python-pdf-renders-in-new-tab-200-application-pdf-but-i-can-t-save[/url]

1756758700

Anonymous

 Я автомагирую сайт инспекций округа Пима с драматургом (Python). Поток: 

[*]  открытые списки: https://publicworks.pima.gov/inspections

  Нажмите на ссылку на запись, которая идет на страницу Accela, как:
/>https://aca-prod.accela.com/pima/cap/capdetail.aspx?module=building&....образной Это открывает новую вкладку на страницу параметров отчета Accela:
https://aca-prod.accela.com/pima/report/reportparameter.aspx?module=building&reporttype=print_permit_summary_report&reportid=762&agencycode=pima>  < /ul>
[b] эта страница затем загружает фактический PDF с: < /strong>

https://aca-prod.accela.com/pima/report/showreport.aspx?module=building&reporttype=print_permit_summary_report&reportid=762&agencycode=pima>  в Browser Is Is Is Wise Pdf Render Prender Prender. Мой сетевой журнал также показывает ответ PDF: < /p>
[code]RESP 200 https://aca-prod.accela.com/PIMA/Report/ShowReport.aspx?Module=Building&reportType=PRINT_PERMIT_SUMMARY_REPORT&reportID=762&agencyCode=PIMA | ct=application/pdf cl=160319
< /code>
… Но мой код никогда не сохраняет байты, это очень расстраивает. CackDownloads = true [/code] не помогает (сервер-это тип контента: приложение/pdf  inline, а не вложение). Я попробовал несколько подходов. Тот же результат. < /Li>
< /ul>
Минимальный код, который воспроизводит < /p>
[code]from pathlib import Path
from playwright.sync_api import sync_playwright

BASE = "https://publicworks.pima.gov/inspections"
DOWNLOADS = Path("downloads"); DOWNLOADS.mkdir(exist_ok=True)

def is_pdf_response(resp):
return ("Report/ShowReport.aspx" in resp.url
and "application/pdf" in (resp.headers.get("content-type","").lower()))

with sync_playwright() as p:
browser = p.chromium.launch(channel="chrome", headless=False)
ctx = browser.new_context(accept_downloads=True)  # inline PDF, so this never fires
page = ctx.new_page()

# (1) Go to listings and click Prev until rows exist (omitted for brevity)
page.goto(BASE)

# (2) Click a record link -> record details page (omitted: selector resolution)
# page.click("a[href*='CapDetail.aspx']")

# (3) Click "View inspection summary" which opens a new tab
with ctx.expect_page() as new_page_info:
page.click("a#ctl00_PlaceHolderMain_lnkPrintSummary")  # link text/ID varies, but this opens the tab
pdf_tab = new_page_info.value

# (4) The parameter page loads, then the PDF URL is fetched by the site.
# Try to catch the actual PDF response:
caught = {"saved": False}

def on_response(resp):
if is_pdf_response(resp):
# Attempt 1: save body() from the response we just saw
content = resp.body()  # 

Подробнее здесь: [url]https://stackoverflow.com/questions/79752888/playwright-python-pdf-renders-in-new-tab-200-application-pdf-but-i-can-t-save[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Превышена максимальная глубина рекурсии при вызове объекта Python с помощью def __str__(self): когда я удаляю объект вст

Последнее сообщение Anonymous « 26 июн 2024, 13:13
Добавлено в форуме Python

Anonymous » 26 июн 2024, 13:13 » в форуме Python

Я сталкиваюсь с ошибкой Превышена максимальная глубина рекурсии... при попытке удалить одну из встроенных форм в администраторе Django.
Это моя модель:
class Correction_Factors(models.Model):

Treatment_unit=...

0 Ответы

43 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 13:13
Какую структуру данных следует использовать для поддержки сопоставлений «ключ-значение», обратной итерации и порядка вст

Последнее сообщение Anonymous « 03 янв 2024, 05:28
Добавлено в форуме JAVA

Anonymous » 03 янв 2024, 05:28 » в форуме JAVA

Какая структура данных из коллекций может эффективно хранить сопоставления «ключ-значение», сохранять порядок вставки и обеспечивать эффективный обратный обход? Структура данных должна быть взята из исходных коллекций Java, поэтому об использовании...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
03 янв 2024, 05:28
Здравствуйте, я студент IB для моего CS IA Я пытаюсь внедрить в свою программу функцию, в которой пользователь может вст

Последнее сообщение Anonymous « 12 фев 2025, 12:55
Добавлено в форуме Python

Anonymous » 12 фев 2025, 12:55 » в форуме Python

Я пытался провести исследование о том, как внедрить эту функцию в программу, и единственное, с чем у меня проблемы, это как заставить ее работать, когда я пытаюсь запустить программу на холостом ходу, я получаю сообщение на своем Компьютер, и он...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
12 фев 2025, 12:55
Можно ли захватить событие контекстного меню «Открыть в новой вкладке» с помощью JavaScript?

Последнее сообщение Anonymous « 30 июн 2024, 09:27
Добавлено в форуме Jquery

Anonymous » 30 июн 2024, 09:27 » в форуме Jquery

Я знаю, что могу использовать захват события щелчка правой кнопкой мыши с помощью «контекстного меню» jQuery, но у меня вопрос: как я могу захватить событие после появления контекстного меню, т. е. когда пользователь нажимает действие «Открыть...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 09:27
Можно ли захватить событие контекстного меню «Открыть в новой вкладке» с помощью JavaScript?

Последнее сообщение Anonymous « 24 ноя 2024, 00:18
Добавлено в форуме Jquery

Anonymous » 24 ноя 2024, 00:18 » в форуме Jquery

Я знаю, что могу использовать захват события щелчка правой кнопкой мыши с помощью «контекстного меню» jQuery, но у меня вопрос: как я могу захватить событие после появления контекстного меню, т. е. когда пользователь нажимает действие «Открыть...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
24 ноя 2024, 00:18

Вернуться в «Python»