Я пытаюсь сделать драматург как можно ближе к обычному экземпляру браузера Chrome, а также ускорить загрузку, переделывая ненужные запросы для таких вещей, как изображения. При этом я заметил, что когда я использую функцию маршрута, мои http-заголовки существенно изменяются. Также обновлены драматург и браузеры.
from playwright.sync_api import sync_playwright
def main():
with sync_playwright() as playwright:
browser = playwright.chromium.launch(channel='chromium', headless=False)
context = browser.new_context()
page = context.new_page()
# page.route('**/*.{.jpg|png}', lambda route: route.abort())
resp = page.goto('https://www.google.com')
print(resp.request.all_headers())
if __name__ == '__main__':
main()
если вы запустите код с раскомментированной строкой, заголовки изменятся по сравнению с исходными.
исходные заголовки:
{':authority': 'www.google.com', ':method': 'GET', ':path': '/', ':scheme': 'https', 'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7', 'accept-encoding': 'gzip, deflate,
br, zstd', 'accept-language': 'en-US,en;q=0.9', 'priority': 'u=0, i', 'sec-ch-ua': '"Chromium";v="131", "Not_A Brand";v="24"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"', 'sec-fetch-dest': 'document', 'sec-fetch-mode': 'navigate', 'sec-fetch-site': 'none', 'sec-fetch-user': '?1', 'upgrade-insecure-requests': '1', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36'}
с маршрутизацией:
{'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7', 'upgrade-insecure-requests': '1', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36', 'sec-ch-ua': '"Chromium";v="131", "Not_A Brand";v="24"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"'}
Подробнее здесь: https://stackoverflow.com/questions/792 ... his-normal
Используя функцию playwright page.route, некоторые заголовки http исчезают, это нормально? ⇐ Python
Программы на Python
1734403932
Anonymous
Я пытаюсь сделать драматург как можно ближе к обычному экземпляру браузера Chrome, а также ускорить загрузку, переделывая ненужные запросы для таких вещей, как изображения. При этом я заметил, что когда я использую функцию маршрута, мои http-заголовки существенно изменяются. Также обновлены драматург и браузеры.
from playwright.sync_api import sync_playwright
def main():
with sync_playwright() as playwright:
browser = playwright.chromium.launch(channel='chromium', headless=False)
context = browser.new_context()
page = context.new_page()
# page.route('**/*.{.jpg|png}', lambda route: route.abort())
resp = page.goto('https://www.google.com')
print(resp.request.all_headers())
if __name__ == '__main__':
main()
если вы запустите код с раскомментированной строкой, заголовки изменятся по сравнению с исходными.
исходные заголовки:
{':authority': 'www.google.com', ':method': 'GET', ':path': '/', ':scheme': 'https', 'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7', 'accept-encoding': 'gzip, deflate,
br, zstd', 'accept-language': 'en-US,en;q=0.9', 'priority': 'u=0, i', 'sec-ch-ua': '"Chromium";v="131", "Not_A Brand";v="24"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"', 'sec-fetch-dest': 'document', 'sec-fetch-mode': 'navigate', 'sec-fetch-site': 'none', 'sec-fetch-user': '?1', 'upgrade-insecure-requests': '1', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36'}
с маршрутизацией:
{'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7', 'upgrade-insecure-requests': '1', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36', 'sec-ch-ua': '"Chromium";v="131", "Not_A Brand";v="24"', 'sec-ch-ua-mobile': '?0', 'sec-ch-ua-platform': '"Windows"'}
Подробнее здесь: [url]https://stackoverflow.com/questions/79286571/using-playwright-page-route-function-some-http-headers-disappear-is-this-normal[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия