Я использую BeautifulSoup для анализа данных на сайте baseball-reference.com, и он работает для каждой страницы, за исключением нескольких, подобных этой. Одни и те же страницы (разные данные) работают отлично, например эта.
Я пытаюсь отфильтровать таблицы с «stats_table» в качестве одного из классов. Я использую этот код:
Код: Выделить всё
bs = BeautifulSoup(stream, 'lxml', parse_only=SoupStrainer('table'))
а потом я делаю что-то вроде:
Код: Выделить всё
for table in bs.find_all('table'):
print table.attrs
... bla bla...
Из table.attrs очевидно, что этот код не видит таблиц подачи и подачи, и что они там есть... Повторяю: тот же код отлично работает почти для всех других страниц, подобных этой.
Просмотр str(bs) ясно показывает, что
ЕЩЁ есть идеи?>
Подробнее здесь:
https://stackoverflow.com/questions/117 ... com-tables