Я пытаюсь извлечь две строки из супа HTML ниже, который поставляется с https://store.steampowered.com/app/2622 ... gn/образно хочу извлечь "Fromsoftware, Inc." и "Bandai Namco Entertainment", которые появляются под лейблом издателя < /p>
Вот HTML. Я знаю, что это немного длинное, но все это необходимо, чтобы воспроизвести ошибку, которую я получаю < /p>
All Reviews:
No user reviews
Release Date:
2025
Developer:
FromSoftware, Inc.
Publisher:
FromSoftware, Inc., Bandai Namco Entertainment
+
< /code>
Я запускаю этот скрипт < /p>
from bs4 import BeautifulSoup
publisher = soup.find('div', class_='dev_row')
publisher_name = publisher.text.strip() if publisher else "N/A"
print(publisher_name)
< /code>
Проблема, которая у меня есть, заключается в том, что я не могу использовать то, что я бы обычно использовал для определения строк: < /p>
Класс "DEV_ROW" повторяется дважды в супе, поэтому я не могу его использовать < /li>
Тэг "a" повторяется дважды в супе < /li>
Я не могу Используйте ссылки, так как я запускаю этот скрипт на нескольких страницах, и ссылка меняется каждый раз < /li>
< /ul>
Обратите внимание, что я очень новый в этом, так что я могу упустить что -то очень очевидное
Подробнее здесь: https://stackoverflow.com/questions/794 ... utifulsoup
Извлекать строки, когда имена классов повторяются (BeautifulSoup) ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Создание отдельных групп в кадре данных, когда значения столбца повторяются
Anonymous » » в форуме Python - 0 Ответы
- 6 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как эффективно извлекать данные из тега скрипта с помощью BeautifulSoup в Python
Anonymous » » в форуме Python - 0 Ответы
- 14 Просмотры
-
Последнее сообщение Anonymous
-