Неверная строка кода:
req = urllib.request.Request(url)
Адрес RSS-канала Rumble, который отлично работает, введенный в адресную строку браузера, возвращает сообщение «403 — авторизация не поможет».
RSS на YouTube адрес канала работает нормально, другие адреса RSS-каналов работают нормально.
Последовательность такова: адрес выбран, грохот дает временное перенаправление на адрес API, а затем это дает 403. Оба оригинала адрес и адрес API отлично работают из адресной строки браузера.
Я добавлял все больше и больше заголовков и т. д.... и нажимаю только на один URL-адрес... так что это так. вряд ли будет дросселирование - нет смысла размещать более умные антиботы в RSS-канале (!), но я все это перепробовал, и это не работает. Любые идеи приветствуются.
К вашему сведению
Это два набора заголовков, которые я пробовал - они не сработали, но сломали ссылки на YouTube. (!).
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Accept-Language': 'en-US,en;q=0.5',
'Accept-Encoding': 'gzip, deflate, br',
'Connection': 'keep-alive',
'Upgrade-Insecure-Requests': '1',
'Sec-Fetch-Dest': 'document',
'Sec-Fetch-Mode': 'navigate',
'Sec-Fetch-Site': 'none',
'Sec-Fetch-User': '?1',
'Cache-Control': 'max-age=0',
}
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0',
'Accept': 'application/rss+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'en-US,en;q=0.5',
'Accept-Encoding': 'gzip, deflate, br',
'Connection': 'keep-alive',
'Referer': 'https://www.rumble.com/',
'Origin': f'https://{parsed_url.netloc}'
}
Оба используются с
req = urllib.request.Request(url, headers=headers)
Подробнее здесь: https://stackoverflow.com/questions/790 ... ib-request
RSS-канал Rumble - выдает 403 при вызове с помощью python urllib.request ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
RSS-канал Rumble - выдает 403 при вызове с помощью python urllib.request
Anonymous » » в форуме Python - 0 Ответы
- 19 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Urllib.error.HTTPError: Ошибка HTTP 403: запрещено с помощью urllib.requests
Anonymous » » в форуме Python - 0 Ответы
- 21 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Python urllib.request.urlopen с аутентификацией носителя в перенаправленном запросе
Anonymous » » в форуме Python - 0 Ответы
- 3 Просмотры
-
Последнее сообщение Anonymous
-