Поиск href на веб-странице https://www.baseball-reference.com/ с помощью веб-скребка Python.

Поиск href на веб-странице https://www.baseball-reference.com/ с помощью веб-скребка Python. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Поиск href на веб-странице https://www.baseball-reference.com/ с помощью веб-скребка Python.

Сообщение Anonymous » 26 окт 2025, 11:15

Я хотел бы очистить все гиперссылки «boxscore», найденные на веб-странице, выделенной в «requests.get» ниже, и распечатать их в электронной таблице Excel. Однако программа ниже печатает весь текст, найденный в классе «игра», с веб-страницы. Что нужно изменить, чтобы он печатал только href-boxscore, найденный в элементах «em» класса «game»?
import requests
from bs4 import BeautifulSoup
import pandas as pd
from openpyxl import load_workbook

wb = load_workbook("tennis_input3.xlsx")
ws = wb.active

response = requests.get('https://www.baseball-reference.com/leag ... dule.shtml')
webpage = response.content
soup = BeautifulSoup(response.text, "html.parser")

col1 = soup.find_all("p", class_="game")

print(pd.DataFrame({"MatchLink":col1}))
df = pd.DataFrame({"MatchLink":col1})

df.to_excel("tennis_3.xlsx", sheet_name="welcome")

Подробнее здесь: https://stackoverflow.com/questions/752 ... python-web

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «Python»