Формат URL -адреса HTML из метода repsitys.text () отличается от MHTML -файла [Duplicate]

Формат URL -адреса HTML из метода repsitys.text () отличается от MHTML -файла [Duplicate] ⇐ Html

1 сообщение • Страница 1 из 1

Anonymous

Формат URL -адреса HTML из метода repsitys.text () отличается от MHTML -файла [Duplicate]

Цитата

Сообщение Anonymous » 08 июл 2025, 23:40

Я изучаю профессор Эванс CS101, часть веб -гусеницы. Я обнаружил, что если я сохраняю веб -сайт, такой как https://xkcd.com/, то я получаю содержимое, такое как:
[*]Archive
[*]What If?
[*]About
[*]Feed=E2=80=A2Email
[*]TW=E2=80=A2FB=E2=80=A2IG
[*]-Books-
[*]What If? 2
[*]WI?=E2=80=A2TE=E2=80=A2HT
< /code>
Но если я использую response.text в запросах lib, то я получаю следующее: < /p>
[*]Archive
[*]What If?
[*]About
[*]Feed•Email
[*]TW•FB•IG
[*]-Books-
[*]What If? 2
[*]WI?•TE•HT

Заметив, что первый URL -адрес, возвращаемый методом response.text в запросах, удалил: « https://xkcd.com », почему это происходит? Есть ли способ избежать этого? Я попробовал метод urllib.request, но я получил те же результаты.response =urllib.request.urlopen("https://xkcd.com/")
webpage = response.read().decode("utf-8")

Подробнее здесь: https://stackoverflow.com/questions/796 ... -mhtml-fil

1752007245

Anonymous

 Я изучаю профессор Эванс CS101, часть веб -гусеницы. Я обнаружил, что если я сохраняю веб -сайт, такой как https://xkcd.com/, то я получаю содержимое, такое как: 
[*][url=3D]Archive[/url]
[*][url=3D]What If?[/url]
[*][url=3D]About[/url]
[*][url=3D]Feed[/url]=E2=80=A2[url=3D]Email[/url]
[*][url=3D]TW[/url]=E2=80=A2[url=3D]FB[/url]=E2=80=A2[url=3D]IG[/url]
[*][url=3D]-Books-[/url]
[*][url=3D]What If? 2[/url]
[*][url=3D]WI?[/url]=E2=80=A2[url=3D]TE[/url]=E2=80=A2[url=3D]HT[/url]
< /code>
Но если я использую response.text в запросах lib, то я получаю следующее: < /p>
[*][url=/archive]Archive[/url]
[*][url=https://what-if.xkcd.com]What If?[/url]
[*][url=/about]About[/url]
[*][url=/atom.xml]Feed[/url]•[url=/newsletter/]Email[/url]
[*][url=https://twitter.com/xkcd/]TW[/url]•[url=https://www.facebook.com/TheXKCD/]FB[/url]•[url=https://www.instagram.com/xkcd/]IG[/url]
[*][url=/books/]-Books-[/url]
[*][url=/what-if-2/]What If? 2[/url]
[*][url=/what-if/]WI?[/url]•[url=/thing-explainer/]TE[/url]•[url=/how-to/]HT[/url]

Заметив, что первый URL -адрес, возвращаемый методом response.text в запросах, удалил: «[b] https://xkcd.com [/b]», почему это происходит? Есть ли способ избежать этого? Я попробовал метод urllib.request, но я получил те же результаты.response =urllib.request.urlopen("https://xkcd.com/")
webpage = response.read().decode("utf-8")
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79686842/html-url-format-from-requests-response-text-method-is-different-from-mhtml-fil[/url]