Итак, я новичок в веб-скрапинге и пытаюсь просмотреть список отзывов о конкретном отеле.
Сначала я пытаюсь просмотреть конкретный отзыв, выбрав определенный класс, и не получаю никаких результатов. даже когда я пытаюсь проверить код состояния запроса, я не получаю никаких результатов. Я считаю, что мой код выполняется очень долго.
Процесс очистки веб-страниц требует времени или в моем коде возникла проблема?
import requests
from bs4 import BeautifulSoup
headers = {
'Access-Control-Allow-Origin': '*',
'Access-Control-Allow-Methods': 'GET',
'Access-Control-Allow-Headers': 'Content-Type',
'Access-Control-Max-Age': '3600',
'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0'
}
url = "https://www.tripadvisor.ca/Hotel_Review ... berta.html"
req = requests.get(url, headers)
print (req.status_code)
soup = BeautifulSoup(req.content, 'html.parser')
review = soup.find_all(class_="XllAv H4 _a").get_text()
print(review)
Подробнее здесь: https://stackoverflow.com/questions/699 ... w-a-review
Веб-скрапинг Python BeautifulSoup Tripadvisor просмотреть обзор ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Веб-скрапинг Python: BeautifulSoup не показывает весь исходный контент HTML
Anonymous » » в форуме Python - 0 Ответы
- 11 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Веб-скрапинг с использованием селена и beautifulsoup для использования в модели RAG.
Anonymous » » в форуме Python - 0 Ответы
- 11 Просмотры
-
Последнее сообщение Anonymous
-