
Я пытаюсь получить некоторые данные по ссылке: http://www.airlinequality .com/airline-reviews/vietjetair/?sortby=post_date%3ADesc&pagesize=100
Например, я пытаюсь с помощью BeautifulSoup извлечь имя каждого рецензента но это не работает. Раньше я пробовал использовать BeautifulSoup с другим сайтом, и все работало отлично! Я не знаю, что происходит. Вы можете помочь мне. Код следующий:
from bs4 import BeautifulSoup
import os
import urllib.request
file1 = open(os.path.expanduser(r"~/Desktop/Skytrax Reviews1.csv"), "wb")
file1.write(b"Reviewer" + b"\n")
WebSites = ["http://www.airlinequality.com/airline-r ... gesize=100"]
# looping through each site until it hits a break. I will create a loop. It is not ready yet
for theurl in WebSites:
thepage = urllib.request.urlopen(theurl)
print(thepage)
soup = BeautifulSoup(thepage,'lxml')
print(soup) #
Подробнее здесь: https://stackoverflow.com/questions/431 ... oup-python
Мобильная версия