Формат URL -адреса HTML из Method Method Office.Text () отличается от файла MHTMLHtml

Программисты Html
Ответить
Anonymous
 Формат URL -адреса HTML из Method Method Office.Text () отличается от файла MHTML

Сообщение Anonymous »

Я изучаю профессор Эванс CS101, часть Web Crawler. Я обнаружил, что если я сохраняю веб -сайт, такой как https://xkcd.com/, то я получаю содержимое, такое как:

Код: Выделить всё

li>[url=3D]Archive[/url]
[*][url=3D]What If?[/url]
[*][url=3D]About[/url]
[*][url=3D]Feed[/url]=E2=80=A2[url=3D]Email[/url]
[*][url=3D]TW[/url]=E2=80=A2[url=3D]FB[/url]=E2=80=A2[url=3D]IG[/url]
[*][url=3D]-Books-[/url]
[*][url=3D]What If? 2[/url]
[*][url=3D]WI?[/url]=E2=80=A2[url=3D]TE[/url]=E2=80=A2[url=3D]HT[/url]
< /code>
Но если я использую response.text в запросах lib, то я получаю следующее: < /p>
[*][url=/archive]Archive[/url]
[*][url=https://what-if.xkcd.com]What If?[/url]
[*][url=/about]About[/url]
[*][url=/atom.xml]Feed[/url]•[url=/newsletter/]Email[/url]
[*][url=https://twitter.com/xkcd/]TW[/url]•[url=https://www.facebook.com/TheXKCD/]FB[/url]•[url=https://www.instagram.com/xkcd/]IG[/url]
[*][url=/books/]-Books-[/url]
[*][url=/what-if-2/]What If? 2[/url]
[*][url=/what-if/]WI?[/url]•[url=/thing-explainer/]TE[/url]•[url=/how-to/]HT[/url]
Заметив, что первый URL -адрес, возвращаемый методом response.text в запросах, удалил: « https://xkcd.com », почему это происходит? Есть ли способ избежать этого? Я попробовал метод urllib.request, но я получил те же результаты.

Подробнее здесь: https://stackoverflow.com/questions/796 ... -mhtml-fil
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»