Я изучаю профессор Эванс CS101, часть веб -гусеницы. Я обнаружил, что если я сохраняю веб -сайт, такой как https://xkcd.com/, то я получаю содержимое, такое как:
[*]Archive
[*]What If?
[*]About
[*]Feed=E2=80=A2Email
[*]TW=E2=80=A2FB=E2=80=A2IG
[*]-Books-
[*]What If? 2
[*]WI?=E2=80=A2TE=E2=80=A2HT
< /code>
Но если я использую response.text в запросах lib, то я получаю следующее: < /p>
[*]Archive
[*]What If?
[*]About
[*]Feed•Email
[*]TW•FB•IG
[*]-Books-
[*]What If? 2
[*]WI?•TE•HT
Заметив, что первый URL -адрес, возвращаемый методом response.text в запросах, удалил: « https://xkcd.com », почему это происходит? Есть ли способ избежать этого? Я попробовал метод urllib.request, но я получил те же результаты.response =urllib.request.urlopen("https://xkcd.com/")
webpage = response.read().decode("utf-8")
Подробнее здесь: https://stackoverflow.com/questions/796 ... -mhtml-fil
Формат URL -адреса HTML из метода repsitys.text () отличается от MHTML -файла [Duplicate] ⇐ Html
Программисты Html
1752007245
Anonymous
Я изучаю профессор Эванс CS101, часть веб -гусеницы. Я обнаружил, что если я сохраняю веб -сайт, такой как https://xkcd.com/, то я получаю содержимое, такое как:
[*][url=3D]Archive[/url]
[*][url=3D]What If?[/url]
[*][url=3D]About[/url]
[*][url=3D]Feed[/url]=E2=80=A2[url=3D]Email[/url]
[*][url=3D]TW[/url]=E2=80=A2[url=3D]FB[/url]=E2=80=A2[url=3D]IG[/url]
[*][url=3D]-Books-[/url]
[*][url=3D]What If? 2[/url]
[*][url=3D]WI?[/url]=E2=80=A2[url=3D]TE[/url]=E2=80=A2[url=3D]HT[/url]
< /code>
Но если я использую response.text в запросах lib, то я получаю следующее: < /p>
[*][url=/archive]Archive[/url]
[*][url=https://what-if.xkcd.com]What If?[/url]
[*][url=/about]About[/url]
[*][url=/atom.xml]Feed[/url]•[url=/newsletter/]Email[/url]
[*][url=https://twitter.com/xkcd/]TW[/url]•[url=https://www.facebook.com/TheXKCD/]FB[/url]•[url=https://www.instagram.com/xkcd/]IG[/url]
[*][url=/books/]-Books-[/url]
[*][url=/what-if-2/]What If? 2[/url]
[*][url=/what-if/]WI?[/url]•[url=/thing-explainer/]TE[/url]•[url=/how-to/]HT[/url]
Заметив, что первый URL -адрес, возвращаемый методом response.text в запросах, удалил: «[b] https://xkcd.com [/b]», почему это происходит? Есть ли способ избежать этого? Я попробовал метод urllib.request, но я получил те же результаты.response =urllib.request.urlopen("https://xkcd.com/")
webpage = response.read().decode("utf-8")
Подробнее здесь: [url]https://stackoverflow.com/questions/79686842/html-url-format-from-requests-response-text-method-is-different-from-mhtml-fil[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия