Проблема с декодированием содержимого запроса httplib2 в Python ⇐ Python
Проблема с декодированием содержимого запроса httplib2 в Python
Доброе утро!
У меня есть следующий код, который использует httplib2 для получения контента по URL-адресу:
из __future__ import unicode_literals импортировать httplib2 запросы на импорт подпроцесс импорта из bs4 импорт BeautifulSoup защита инициализации(): глобальный URL-адрес URL = "http://nottherealurl.com" глобальный заголовок заголовок = set_header() защита set_header(): возвращаться { "Принять":"text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8", "Accept-Encoding":"gzip, deflate, br", "Content-Type":"text/html; charset=utf-8", "Accept-Language":"en-US,en;q=0.5", "Соединение":"Поддержание активности", "ДНТ":"1", "Sec-Fetch-Dest":"документ", "Sec-Fetch-Mode":"navigate", "Sec-Fetch-Site":"межсайтовый", "Sec-Fetch-User":"?1", "Сек-ГПХ":"1", "Небезопасные запросы на обновление":"1", "TE":"трейлеры", «Агент пользователя»: «Mozilla/5.0 (Windows NT 10.0; rv:122.0) Gecko/20100101 Firefox/122.0» } защита get_url(): инициализировать() ч = httplib2.Http() (соответственно, контент) = h.request(url,"GET",headers=header) распечатать (содержание) Я вызываю get_url(), чтобы получить содержимое URL-адреса; однако он возвращает двоичные данные, подобные этому b'\x90\x03\x02\x80\xfc-\xd5\xfe\xec\\N.
У меня нет такой проблемы при тестировании URL-адреса в Cygwin Curl.
Доброе утро!
У меня есть следующий код, который использует httplib2 для получения контента по URL-адресу:
из __future__ import unicode_literals импортировать httplib2 запросы на импорт подпроцесс импорта из bs4 импорт BeautifulSoup защита инициализации(): глобальный URL-адрес URL = "http://nottherealurl.com" глобальный заголовок заголовок = set_header() защита set_header(): возвращаться { "Принять":"text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8", "Accept-Encoding":"gzip, deflate, br", "Content-Type":"text/html; charset=utf-8", "Accept-Language":"en-US,en;q=0.5", "Соединение":"Поддержание активности", "ДНТ":"1", "Sec-Fetch-Dest":"документ", "Sec-Fetch-Mode":"navigate", "Sec-Fetch-Site":"межсайтовый", "Sec-Fetch-User":"?1", "Сек-ГПХ":"1", "Небезопасные запросы на обновление":"1", "TE":"трейлеры", «Агент пользователя»: «Mozilla/5.0 (Windows NT 10.0; rv:122.0) Gecko/20100101 Firefox/122.0» } защита get_url(): инициализировать() ч = httplib2.Http() (соответственно, контент) = h.request(url,"GET",headers=header) распечатать (содержание) Я вызываю get_url(), чтобы получить содержимое URL-адреса; однако он возвращает двоичные данные, подобные этому b'\x90\x03\x02\x80\xfc-\xd5\xfe\xec\\N.
У меня нет такой проблемы при тестировании URL-адреса в Cygwin Curl.
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Проблема с декодированием URL-адресов Новостей Google, содержащих информацию о согласии.
Anonymous » » в форуме Python - 0 Ответы
- 18 Просмотры
-
Последнее сообщение Anonymous
-