Извлекать строки, когда имена классов повторяются (BeautifulSoup)

Извлекать строки, когда имена классов повторяются (BeautifulSoup) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Извлекать строки, когда имена классов повторяются (BeautifulSoup)

Цитата

Сообщение Anonymous » 12 фев 2025, 07:56

Я пытаюсь извлечь две строки из супа HTML ниже, который поставляется с https://store.steampowered.com/app/2622 ... gn/образно хочу извлечь "Fromsoftware, Inc." и "Bandai Namco Entertainment", которые появляются под лейблом издателя < /p>
Вот HTML. Я знаю, что это немного длинное, но все это необходимо, чтобы воспроизвести ошибку, которую я получаю < /p>

All Reviews:
No user reviews

Release Date:
2025

Developer:

FromSoftware, Inc.

Publisher:

FromSoftware, Inc., Bandai Namco Entertainment

+

< /code>
Я запускаю этот скрипт < /p>
from bs4 import BeautifulSoup

publisher = soup.find('div', class_='dev_row')
publisher_name = publisher.text.strip() if publisher else "N/A"

print(publisher_name)
< /code>
Проблема, которая у меня есть, заключается в том, что я не могу использовать то, что я бы обычно использовал для определения строк: < /p>

Класс "DEV_ROW" повторяется дважды в супе, поэтому я не могу его использовать < /li>
Тэг "a" повторяется дважды в супе < /li>
Я не могу Используйте ссылки, так как я запускаю этот скрипт на нескольких страницах, и ссылка меняется каждый раз < /li>
< /ul>
Обратите внимание, что я очень новый в этом, так что я могу упустить что -то очень очевидное

Подробнее здесь: https://stackoverflow.com/questions/794 ... utifulsoup

1739336193

Anonymous

 Я пытаюсь извлечь две строки из супа HTML ниже, который поставляется с https://store.steampowered.com/app/2622380/elden_ring_nightreign/образно хочу извлечь "Fromsoftware, Inc." и "Bandai Namco Entertainment", которые появляются под лейблом издателя < /p>
Вот HTML. Я знаю, что это немного длинное, но все это необходимо, чтобы воспроизвести ошибку, которую я получаю < /p>



All Reviews:
No user reviews



Release Date:
2025


Developer:

[url=https://store.steampowered.com/curator/45188208?snr=1_5_9__2000]FromSoftware, Inc.[/url]



Publisher:

[url=https://store.steampowered.com/curator/45188208?snr=1_5_9__2000]FromSoftware, Inc.[/url], [url=https://store.steampowered.com/curator/45188208?snr=1_5_9__2000]Bandai Namco Entertainment[/url]

+

< /code>
Я запускаю этот скрипт < /p>
from bs4 import BeautifulSoup

publisher = soup.find('div', class_='dev_row')
publisher_name = publisher.text.strip() if publisher else "N/A"

print(publisher_name)
< /code>
Проблема, которая у меня есть, заключается в том, что я не могу использовать то, что я бы обычно использовал для определения строк: < /p>

 Класс "DEV_ROW" повторяется дважды в супе, поэтому я не могу его использовать < /li>
 Тэг "a" повторяется дважды в супе < /li>
 Я не могу Используйте ссылки, так как я запускаю этот скрипт на нескольких страницах, и ссылка меняется каждый раз < /li>
< /ul>
Обратите внимание, что я очень новый в этом, так что я могу упустить что -то очень очевидное  

Подробнее здесь: [url]https://stackoverflow.com/questions/79431961/extract-strings-when-class-names-are-repeated-beautifulsoup[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Vite.js переименовывает имена классов CSS. Как тогда использовать имена классов в селекторах CSS?

Последнее сообщение Гость « 09 мар 2024, 11:46
Добавлено в форуме CSS

Гость » 09 мар 2024, 11:46 » в форуме CSS

I have this code:

import styles from ../styles/dragdrop.module.css ; (...) return ( ); After building the project with vite, the code looks like this:

(the CSS classname has changed from dragDrop to _dragDrop_d8kak_45 ).

But I'm using CSS...

0 Ответы

116 Просмотры

Последнее сообщение Гость
09 мар 2024, 11:46
Создание отдельных групп в кадре данных, когда значения столбца повторяются

Последнее сообщение Anonymous « 12 дек 2024, 18:04
Добавлено в форуме Python

Anonymous » 12 дек 2024, 18:04 » в форуме Python

У меня есть фрейм данных с числами в следующем формате:
df = pd.DataFrame({ ColumnA : , ColumnB : , ColumnC : })

Что дает:

СтолбецA
Столбец B
СтолбецC

1
1
0

2
3
1

3
5
1

4
62

5
4
0

6
7
2

7
5
1

8
4
1

9
10

10
2
1

Я хочу...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 18:04
Как эффективно извлекать данные из тега скрипта с помощью BeautifulSoup в Python

Последнее сообщение Anonymous « 09 окт 2024, 12:59
Добавлено в форуме Python

Anonymous » 09 окт 2024, 12:59 » в форуме Python

Я извлекаю данные из тега с помощью Python по URL-адресу, как показано ниже:
response = session.get( example.com )

soup = BeautifulSoup(response.content,features='html.parser')
all_scripts = soup.find_all('script')
desiredScript = all_scripts...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 12:59
Извлекать имена столбцов из файла Oracle SQL

Последнее сообщение Anonymous « 26 янв 2025, 20:08
Добавлено в форуме Python

Anonymous » 26 янв 2025, 20:08 » в форуме Python

Можно ли получить имена столбцов из файла sql (специфического для Oracle), который содержит какие-либо операторы (dml,ddl,pl/sql), используя Python?

Подробнее здесь:

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
26 янв 2025, 20:08
Извлекать тексты из строки

Последнее сообщение Anonymous « 11 июл 2025, 08:19
Добавлено в форуме JAVA

Anonymous » 11 июл 2025, 08:19 » в форуме JAVA

Я следующий за строкой, которая является html -

Repository

Subversion

..

branch_A

branch_B

Из этого я хочу получить метки li тега, которые являются branch_a , fancom_b
count of li может варьироваться. Я хочу получить...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
11 июл 2025, 08:19

Вернуться в «Python»