Как мне получить конкретные данные, которые мне нужны?Python

Программы на Python
Ответить
Anonymous
 Как мне получить конкретные данные, которые мне нужны?

Сообщение Anonymous »

Я впервые осваиваю парсинг данных, и у меня возникли проблемы с получением конкретных данных, которые мне нужны. В конечном итоге я хочу идентифицировать всех игроков, которые родились и/или играли в бейсбол в средней школе в Колорадо, и сохранить их имена и места рождения в словаре. Я могу идентифицировать теги, в которых содержатся данные, но мне не удалось успешно получить данные.
Я тщательно изучал парсинг, но не смог смог добиться большого прогресса. Мне кажется, что мне нужно использовать суп.find_all('tag', attrs={}) для анализа нужных мне данных, но у меня возникли трудности с определением того, как идентифицировать нужные мне данные с помощью 'attrs'. Если уже есть соответствующая публикация по этой теме, я буду рад ее рассмотреть. Мне не удалось найти сообщение, которое было бы полезным, вероятно, из-за отсутствия технических знаний с моей стороны.
Если домашняя страница B-Ref https://www.baseball-reference .com/.
Спасибо

Код: Выделить всё

#Python program to scrape website

import requests
import html5lib
from bs4 import BeautifulSoup
import csv

URL = 'https://www.baseball-reference.com/players/p/paytoja01.shtml'
r = requests.get(URL)

soup = BeautifulSoup(r.content, 'html5lib')

#print(soup.prettify())

a_tag = soup.find_all('a')

print(a_tag)
#Colorado_Born_and_HS = {}
#Colorado_Born = {}
#Colorado_HS = {}
Я пробовал различные подходы, включая Soup.find, .find_all, .find_all_next, .next_siblings и т. д. Я не включил их все в пример своего кода, потому что это было беспорядочно, и я думаю, что на этот вопрос есть относительно простой ответ.

Подробнее здесь: https://stackoverflow.com/questions/792 ... ata-i-want
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»