Как мне получить конкретные данные, которые мне нужны? - Цифровое Кемерово

Как мне получить конкретные данные, которые мне нужны? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как мне получить конкретные данные, которые мне нужны?

Цитата

Сообщение Anonymous » 24 ноя 2024, 02:42

Я впервые осваиваю парсинг данных, и у меня возникли проблемы с получением конкретных данных, которые мне нужны. В конечном итоге я хочу идентифицировать всех игроков, которые родились и/или играли в бейсбол в средней школе в Колорадо, и сохранить их имена и места рождения в словаре. Я могу идентифицировать теги, в которых содержатся данные, но мне не удалось успешно получить данные.
Я тщательно изучал парсинг, но не смог смог добиться большого прогресса. Мне кажется, что мне нужно использовать суп.find_all('tag', attrs={}) для анализа нужных мне данных, но у меня возникли трудности с определением того, как идентифицировать нужные мне данные с помощью 'attrs'. Если уже есть соответствующая публикация по этой теме, я буду рад ее рассмотреть. Мне не удалось найти сообщение, которое было бы полезным, вероятно, из-за отсутствия технических знаний с моей стороны.
Если домашняя страница B-Ref https://www.baseball-reference .com/.
Спасибо

Код: Выделить всё

#Python program to scrape website

import requests
import html5lib
from bs4 import BeautifulSoup
import csv

URL = 'https://www.baseball-reference.com/players/p/paytoja01.shtml'
r = requests.get(URL)

soup = BeautifulSoup(r.content, 'html5lib')

#print(soup.prettify())

a_tag = soup.find_all('a')

print(a_tag)
#Colorado_Born_and_HS = {}
#Colorado_Born = {}
#Colorado_HS = {}

Я пробовал различные подходы, включая Soup.find, .find_all, .find_all_next, .next_siblings и т. д. Я не включил их все в пример своего кода, потому что это было беспорядочно, и я думаю, что на этот вопрос есть относительно простой ответ.

Подробнее здесь: https://stackoverflow.com/questions/792 ... ata-i-want

1732405341

Anonymous

Я впервые осваиваю парсинг данных, и у меня возникли проблемы с получением конкретных данных, которые мне нужны. В конечном итоге я хочу идентифицировать всех игроков, которые родились и/или играли в бейсбол в средней школе в Колорадо, и сохранить их имена и места рождения в словаре. Я могу идентифицировать теги, в которых содержатся данные, но мне не удалось успешно получить данные.
Я тщательно изучал парсинг, но не смог смог добиться большого прогресса. Мне кажется, что мне нужно использовать суп.find_all('tag', attrs={}) для анализа нужных мне данных, но у меня возникли трудности с определением того, как идентифицировать нужные мне данные с помощью 'attrs'. Если уже есть соответствующая публикация по этой теме, я буду рад ее рассмотреть. Мне не удалось найти сообщение, которое было бы полезным, вероятно, из-за отсутствия технических знаний с моей стороны.
Если домашняя страница B-Ref https://www.baseball-reference .com/.
Спасибо
[code]#Python program to scrape website

import requests
import html5lib
from bs4 import BeautifulSoup
import csv

URL = 'https://www.baseball-reference.com/players/p/paytoja01.shtml'
r = requests.get(URL)

soup = BeautifulSoup(r.content, 'html5lib')

#print(soup.prettify())

a_tag = soup.find_all('a')

print(a_tag)
#Colorado_Born_and_HS = {}
#Colorado_Born = {}
#Colorado_HS = {}
[/code]
Я пробовал различные подходы, включая Soup.find, .find_all, .find_all_next, .next_siblings и т. д. Я не включил их все в пример своего кода, потому что это было беспорядочно, и я думаю, что на этот вопрос есть относительно простой ответ. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79219062/how-do-i-scrape-the-specific-data-i-want[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»