Парсинг с помощью Beautifulsoup-Python - Цифровое Кемерово

Парсинг с помощью Beautifulsoup-Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 26 дек 2024, 07:09

Я пытаюсь получить некоторые данные по ссылке: http://www.airlinequality .com/airline-reviews/vietjetair/?sortby=post_date%3ADesc&pagesize=100
Например, я пытаюсь с помощью BeautifulSoup извлечь имя каждого рецензента но это не работает. Раньше я пробовал использовать BeautifulSoup с другим сайтом, и все работало отлично! Я не знаю, что происходит. Вы можете помочь мне. Код следующий:
from bs4 import BeautifulSoup
import os
import urllib.request

file1 = open(os.path.expanduser(r"~/Desktop/Skytrax Reviews1.csv"), "wb")

file1.write(b"Reviewer" + b"\n")

WebSites = ["http://www.airlinequality.com/airline-r ... gesize=100"]

# looping through each site until it hits a break. I will create a loop. It is not ready yet
for theurl in WebSites:
thepage = urllib.request.urlopen(theurl)
print(thepage)
soup = BeautifulSoup(thepage,'lxml')
print(soup) #

Подробнее здесь: https://stackoverflow.com/questions/431 ... oup-python

1735186149

Anonymous


[img]https://i.sstatic.net/AkqiQ.jpg[/img]
Я пытаюсь получить некоторые данные по ссылке: http://www.airlinequality .com/airline-reviews/vietjetair/?sortby=post_date%3ADesc&pagesize=100
Например, я пытаюсь с помощью BeautifulSoup извлечь имя каждого рецензента но это не работает. Раньше я пробовал использовать BeautifulSoup с другим сайтом, и все работало отлично! Я не знаю, что происходит. Вы можете помочь мне. Код следующий:
from bs4 import BeautifulSoup
import os
import urllib.request

file1 = open(os.path.expanduser(r"~/Desktop/Skytrax Reviews1.csv"), "wb")

file1.write(b"Reviewer" + b"\n")

WebSites = ["http://www.airlinequality.com/airline-reviews/vietjetair/?sortby=post_date%3ADesc&pagesize=100"]

# looping through each site until it hits a break. I will create a loop. It is not ready yet
for theurl in WebSites:
thepage = urllib.request.urlopen(theurl)
print(thepage)
soup = BeautifulSoup(thepage,'lxml')
print(soup)    #

Подробнее здесь: [url]https://stackoverflow.com/questions/43143599/sraping-with-beautifulsoup-python[/url]