Я новичок в веб-скрапинге и хотел очистить несколько HTML-таблиц с помощью BeautifulSoup на Python. Веб-страница:
https://fbref.com/en/comps/9/keepers/Pr ... ague-Stats. Как вы увидите, есть две таблицы «Вратарский состав» и «Вратарский состав».
Используя следующий код, я могу получить обе таблицы.
Код: Выделить всё
from bs4 import BeautifulSoup
import requests
import pandas as pd
import re
url = 'https://fbref.com/en/comps/9/keepers/Premier-League-Stats'
html_content = requests.get(url).text
bs = BeautifulSoup(html_content,"lxml")
gk_stats = bs.find_all("div",attrs={"class":"table_wrapper"})
gk_stats содержит 2 элемента «Вратарский состав» и «Вратарский состав», которые я могу увидеть, проиндексировав gk_stats[0] и gk_stats[1] соответственно. Однако, когда я пытаюсь найти тег «tr» в разделе «Вратарь игрока», он выдает пустой список.
Может ли кто-нибудь объяснить мне, почему я не могу извлечь таблицу, хотя она у меня есть как элемент BeautifulSoup? Я также могу видеть таблицу, когда проверяю элемент в браузере Chrome.
Я могу извлечь таблицу «Вратарь отряда» с помощью той же команды, но с индексом 0 gk_stats[0].find_all("tr")
Заранее спасибо.
Подробнее здесь:
https://stackoverflow.com/questions/666 ... utifulsoup