Я хотел бы очистить все гиперссылки «boxscore», найденные на веб-странице, выделенной в «requests.get» ниже, и распечатать их в электронной таблице Excel. Однако программа ниже печатает весь текст, найденный в классе «игра», с веб-страницы. Что нужно изменить, чтобы он печатал только href-boxscore, найденный в элементах «em» класса «game»?
import requests
from bs4 import BeautifulSoup
import pandas as pd
from openpyxl import load_workbook
wb = load_workbook("tennis_input3.xlsx")
ws = wb.active
response = requests.get('https://www.baseball-reference.com/leag ... dule.shtml')
webpage = response.content
soup = BeautifulSoup(response.text, "html.parser")
col1 = soup.find_all("p", class_="game")
print(pd.DataFrame({"MatchLink":col1}))
df = pd.DataFrame({"MatchLink":col1})
df.to_excel("tennis_3.xlsx", sheet_name="welcome")
Подробнее здесь: https://stackoverflow.com/questions/752 ... python-web