Парсинг с помощью Beautifulsoup-PythonPython

Программы на Python
Ответить
Anonymous
 Парсинг с помощью Beautifulsoup-Python

Сообщение Anonymous »


Изображение
Я пытаюсь получить некоторые данные по ссылке: http://www.airlinequality .com/airline-reviews/vietjetair/?sortby=post_date%3ADesc&pagesize=100
Например, я пытаюсь с помощью BeautifulSoup извлечь имя каждого рецензента но это не работает. Раньше я пробовал использовать BeautifulSoup с другим сайтом, и все работало отлично! Я не знаю, что происходит. Вы можете помочь мне. Код следующий:
from bs4 import BeautifulSoup
import os
import urllib.request

file1 = open(os.path.expanduser(r"~/Desktop/Skytrax Reviews1.csv"), "wb")

file1.write(b"Reviewer" + b"\n")

WebSites = ["http://www.airlinequality.com/airline-r ... gesize=100"]

# looping through each site until it hits a break. I will create a loop. It is not ready yet
for theurl in WebSites:
thepage = urllib.request.urlopen(theurl)
print(thepage)
soup = BeautifulSoup(thepage,'lxml')
print(soup) #

Подробнее здесь: https://stackoverflow.com/questions/431 ... oup-python
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»