Как я могу очистить таблицу от справочника по бейсболу, используя панд и красивый суп?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как я могу очистить таблицу от справочника по бейсболу, используя панд и красивый суп?

Сообщение Anonymous »

Я пытаюсь собрать статистику подачи по этому URL-адресу, а затем сохранить фрейм данных в файл csv.
https://www.baseball-reference.com/boxes/ARI /ARI202204070.shtml
Мой текущий код приведен ниже (Python 3.9.7)

Код: Выделить всё

_URL = "https://www.baseball-reference.com/boxes/ARI/ARI202204070.shtml"
data = pd.read_html(_URL,attrs={'id': 'ArizonaDiamondbackspitching'},header=1)[0]
data.to_csv('boxscore.csv', index='False')
return data
Когда я запускаю этот код, я получаю следующую ошибку:

Код: Выделить всё

Traceback (most recent call last):
File "d:\BaseballAlgo\Baseball_WhoWins.py", line 205, in 
getBoxScore('ARI','2022-04-07')
File "d:\BaseballAlgo\Baseball_WhoWins.py", line 99, in getBoxScore
data = pd.read_html(_URL,attrs={'id': 'ArizonaDiamondbackspitching'},header=1)[0]
File "D:\BaseballAlgo\.venv\lib\site-packages\pandas\io\html.py", line 1240, in   read_html
return _parse(
File "D:\BaseballAlgo\.venv\lib\site-packages\pandas\io\html.py", line 1003, in _parse
raise retained
File "D:\BaseballAlgo\.venv\lib\site-packages\pandas\io\html.py", line 983, in   _parse
tables = p.parse_tables()
File "D:\BaseballAlgo\.venv\lib\site-packages\pandas\io\html.py", line 249, in parse_tables
tables = self._parse_tables(self._build_doc(), self.match, self.attrs)
File "D:\BaseballAlgo\.venv\lib\site-packages\pandas\io\html.py", line 598, in   _parse_tables
raise ValueError("No tables found")
ValueError: No tables found
Предыдущие итерации кода:

Код: Выделить всё

session = BRefSession()
_URL = "https://www.baseball-reference.com/boxes/ARI/ARI202204070.shtml"
content =session.get(_URL).content
soup = BeautifulSoup(content, "html.parser")
table = soup.find_all('table', id="ArizonaDiamondbackspitching")
print (table)
data = pd.read_html(StringIO(str(table)))[0]
Этот код запускается, и когда он печатает таблицу, на выходе получается «[]». В результате последней строки выводится та же самая обратная трассировка, что и выше.
Я понимаю, о чем говорит ошибка, но просто не понимаю, как это возможно. Кажется, что функция Soup.findall не может найти нужную мне таблицу, но я не знаю, почему. Как я могу решить эту проблему?

Подробнее здесь: https://stackoverflow.com/questions/793 ... tiful-soup
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»