Playwright получает разные результаты, если в режиме без головы (ошибка 405 запрещена)Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Playwright получает разные результаты, если в режиме без головы (ошибка 405 запрещена)

Сообщение Anonymous »

Код: Выделить всё

#!/usr/bin/env python3

from playwright.sync_api import sync_playwright
from bs4 import BeautifulSoup
import json
from pathlib import Path

def scrape_urlhaus():
with sync_playwright() as p:
browser = p.chromium.launch(headless=True, slow_mo=1200)
context = browser.new_context(
viewport={'width': 1366, 'height': 768},
)
context.add_init_script("Object.defineProperty(navigator, 'webdriver', {get: () => undefined})")
context.add_cookies(json.loads(Path("urlhaus_cookies.json").read_text()))
page = context.new_page()
page.goto("https://urlhaus.abuse.ch/")
page.screenshot(path="debug_screenshot.png")
page.wait_for_selector('a.nav-link[href="/browse/"]')
page.click('a.nav-link[href="/browse/"]')
page.wait_for_selector('table.table.table-sm.table-hover.table-bordered')
content = page.content()
Я пишу программу для сокраски Urlhaus rebese Page, однако сценарий работает, когда я устанавливаю Headless = true и я получаю Ошибка, но этого нет, когда я использую Headless = false , когда я получаю обычное представление страницы.

Подробнее здесь: https://stackoverflow.com/questions/793 ... 405-banned
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»