HTML-код не загружается полностью перед попыткой его проверкиPython

Программы на Python
Ответить
Anonymous
 HTML-код не загружается полностью перед попыткой его проверки

Сообщение Anonymous »

Код: Выделить всё

    url = booklink[0].replace('/index.html', '/page' + str(pages) + '.html')
req = Request(url,headers={'User-Agent': 'Mozilla/5.0'})
page = urlopen(req).read()
htm = BeautifulSoup(page, 'html.parser')
html = htm.prettify()
Я пытаюсь загрузить HTML-код с веб-страницы, а затем извлечь из него что-то. Большую часть времени он работает нормально. В других случаях, когда я захожу на re.findall, он возвращается и сообщает, что ничего не нашел, даже на той же странице. Похоже, я имею дело со случаем, когда веб-страница не загружается полностью до того, как программа пытается проверить HTML-код.
Я уже пробовал такие вещи, как:

Код: Выделить всё

response = requests.get(url, stream=True)
soup = BeautifulSoup(response.raw.read(), 'html.parser')
и

Код: Выделить всё

with urllib.request.urlopen(url) as response:
source_code = response.read().decode('utf-8')
с гораздо худшей производительностью, включая загрузку первого элемента, а затем постоянное повторение вместо того, чтобы захватить следующий элемент и поместить его в текстовый файл.
Как мне заставить программу убедиться, что вся веб-страница загружена, прежде чем она попытается ее очистить?>

Подробнее здесь: https://stackoverflow.com/questions/798 ... examine-it
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»