Как выбрать конкретный тег div или pragraph из HTML-контента с помощью красивого супа?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как выбрать конкретный тег div или pragraph из HTML-контента с помощью красивого супа?

Сообщение Anonymous »

Я использую Beautiful Soup, чтобы извлечь текстовое содержимое из данных HTML. У меня есть тег div и несколько абзацев, а последний абзац — это информация об авторских правах с логотипом авторских прав, годом и некоторой дополнительной информацией. год отличается в зависимости от того, в каком году был контент, поэтому я не могу найти точный текст, но остальное всегда одно и то же, за исключением переменного года.
есть ли способ, которым я могу это сделать? удалить/проигнорировать последний абзац?

Код: Выделить всё

from bs4 import BeautifulSoup

text_content = '
here is the header information 

 some text content 
 
 another block of text
 .....
 2024 copyright , all rights reserved 
'

bs = BeautifulSoup(text_content, "html.parser")

only_text = " ".join([p.text for p in soup.find_all("p")])
Я использовал красивый суп, чтобы получить весь текстовый контент, теперь я хочу удалить определенный абзац.

Подробнее здесь: https://stackoverflow.com/questions/791 ... -beautiful
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»