Я тщательно изучал парсинг, но не смог смог добиться большого прогресса. Мне кажется, что мне нужно использовать суп.find_all('tag', attrs={}) для анализа нужных мне данных, но у меня возникли трудности с определением того, как идентифицировать нужные мне данные с помощью 'attrs'. Если уже есть соответствующая публикация по этой теме, я буду рад ее рассмотреть. Мне не удалось найти сообщение, которое было бы полезным, вероятно, из-за отсутствия технических знаний с моей стороны.
Если домашняя страница B-Ref https://www.baseball-reference .com/.
Спасибо
Код: Выделить всё
#Python program to scrape website
import requests
import html5lib
from bs4 import BeautifulSoup
import csv
URL = 'https://www.baseball-reference.com/players/p/paytoja01.shtml'
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html5lib')
#print(soup.prettify())
a_tag = soup.find_all('a')
print(a_tag)
#Colorado_Born_and_HS = {}
#Colorado_Born = {}
#Colorado_HS = {}
Подробнее здесь: https://stackoverflow.com/questions/792 ... ata-i-want
Мобильная версия