Поиск href на веб-странице https://www.baseball-reference.com/ с помощью веб-скребка Python.Python

Программы на Python
Anonymous
 Поиск href на веб-странице https://www.baseball-reference.com/ с помощью веб-скребка Python.

Сообщение Anonymous »

Я хотел бы очистить все гиперссылки «boxscore», найденные на веб-странице, выделенной в «requests.get» ниже, и распечатать их в электронной таблице Excel. Однако программа ниже печатает весь текст, найденный в классе «игра», с веб-страницы. Что нужно изменить, чтобы он печатал только href-boxscore, найденный в элементах «em» класса «game»?
import requests
from bs4 import BeautifulSoup
import pandas as pd
from openpyxl import load_workbook

wb = load_workbook("tennis_input3.xlsx")
ws = wb.active

response = requests.get('https://www.baseball-reference.com/leag ... dule.shtml')
webpage = response.content
soup = BeautifulSoup(response.text, "html.parser")

col1 = soup.find_all("p", class_="game")

print(pd.DataFrame({"MatchLink":col1}))
df = pd.DataFrame({"MatchLink":col1})

df.to_excel("tennis_3.xlsx", sheet_name="welcome")


Подробнее здесь: https://stackoverflow.com/questions/752 ... python-web

Вернуться в «Python»