Как извлечь текст из вложенных тегов в цикле BeautifulSoup?Python

Программы на Python
Ответить
Anonymous
 Как извлечь текст из вложенных тегов в цикле BeautifulSoup?

Сообщение Anonymous »

Я пытаюсь очистить метаданные с https://yellowpages.com.eg/en/category/abrasives, используя Selenium и BeautifulSoup. Я могу успешно извлечь некоторые данные, но у меня возникли проблемы с получением текста из тега, вложенного в элемент div внутри цикла. Вот мой текущий код:
Вложенные теги — просмотрите этот SS

Код: Выделить всё


pagecount = 1
driver = webdriver.Chrome()
page_url = f"{base_url}/en/category/abrasives/p{pagecount}"
driver.get(page_url)
driver.implicitly_wait(10)
page_source = driver.page_source
time.sleep(1)
bs = BeautifulSoup(page_source, 'html.parser')
divs = bs.find_all('div', class_ = 'col-xs-12 item-details')
for div in divs:
img_tag = div.find('img')
if(img_tag):
img_src = img_tag['data-src']
print(img_src)
else:
# print("i provided no tag be off stupid")
pass
title = div.find('a', class_ = 'item-title').text.strip()
print(title)
address = div.find('a', class_ = 'address-text').find('span').text.strip()
print(address)
# description = div.find('div', class_ = 'item-aboutUs' )
descriptions = div.find_all('div', class_='item-aboutUs')
print(descriptions)
Проблема:
Я хочу убедиться, что я правильно извлекаю текст из тега a внутри элемента div item-aboutUs. Есть ли лучший способ справиться с этим, особенно если существует несколько элементов div item-aboutUs?

Подробнее здесь: https://stackoverflow.com/questions/791 ... lsoup-loop
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»