Как использовать Selenium+BeautifulSoup для получения данных из динамически создаваемых элементов

Как использовать Selenium+BeautifulSoup для получения данных из динамически создаваемых элементов ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как использовать Selenium+BeautifulSoup для получения данных из динамически создаваемых элементов

Цитата

Сообщение Anonymous » 13 окт 2024, 19:39

Первый вопрос по StackOverFlow. Я пытаюсь очистить веб-страницу fxstreet.com/news. Похоже, их новостная лента динамично выпускает статьи. BeautifulSoup не может собрать эту информацию, поэтому я решил использовать Selenium. Однако у меня возникли проблемы с использованием Selenium для доступа к отображаемым статьям.

Код: Выделить всё

import requests
from bs4 import BeautifulSoup
import re
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get('https://www.fxstreet.com/news?q=&hPP=17&idx=FxsIndexPro&p=0')

article = driver.find_element_by_link_text('/news')
for post in article:
print(post.text)

Я хотел бы создать парсер, который периодически проверяет наличие новых статей. Эти статьи будут иметь URL-адрес: https://www.fxstreet.com/news.. .(конечная точка).

Однако, когда я пытаюсь найти тег hrefs/'a', я получаю много ссылок по всему веб-сайту, но ни одна из них не является новостью. статьи, представленные в прямом эфире. Когда я просматриваю каждый элемент div, я получаю весь HTML-код:

Код: Выделить всё

                    [url=https://www.fxstreet.com/news/gbp-usd-upside-potential-limited-in-covid-19-uncertainties-202004021808]GBP/USD upside potential limited in COVID-19 uncertainties[/url]

[url=/author/ross-j-burland]Ross J Burland[/url]
 | 18:08 GMT

говорит мне, что оно где-то каким-то образом существует, но я совершенно не могу с ним взаимодействовать. Итак, как мне получить доступ к нужным мне ссылкам, если Selenium не может искать теги «a» или частичные ссылки? Я также попытался найти точную ссылку, используя:

Код: Выделить всё

elem = driver.find_elements_partial_link("news")

for element in elem:
print(element.get_attribute("innerHTML"))

Безрезультатно. Я также пробовал использовать явное и неявное ожидание. Спасибо.

Подробнее здесь: https://stackoverflow.com/questions/610 ... d-elements

1728837568

Anonymous

Первый вопрос по StackOverFlow. Я пытаюсь очистить веб-страницу fxstreet.com/news. Похоже, их новостная лента динамично выпускает статьи. BeautifulSoup не может собрать эту информацию, поэтому я решил использовать Selenium. Однако у меня возникли проблемы с использованием Selenium для доступа к отображаемым статьям. 

[code]import requests
from bs4 import BeautifulSoup
import re
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get('https://www.fxstreet.com/news?q=&hPP=17&idx=FxsIndexPro&p=0')

article = driver.find_element_by_link_text('/news')
for post in article:
print(post.text)
[/code]

Я хотел бы создать парсер, который периодически проверяет наличие новых статей. Эти статьи будут иметь URL-адрес: https://www.fxstreet.com/news.. .(конечная точка).

Однако, когда я пытаюсь найти тег hrefs/'a', я получаю много ссылок по всему веб-сайту, но ни одна из них не является новостью. статьи, представленные в прямом эфире. Когда я просматриваю каждый элемент div, я получаю весь HTML-код:

[code]                    [url=https://www.fxstreet.com/news/gbp-usd-upside-potential-limited-in-covid-19-uncertainties-202004021808]GBP/USD upside potential limited in COVID-19 uncertainties[/url]

[url=/author/ross-j-burland]Ross J Burland[/url]
 | 18:08 GMT


[/code]

говорит мне, что оно где-то каким-то образом существует, но я совершенно не могу с ним взаимодействовать. Итак, как мне получить доступ к нужным мне ссылкам, если Selenium не может искать теги «a» или частичные ссылки? Я также попытался найти точную ссылку, используя:

[code]elem = driver.find_elements_partial_link("news")

for element in elem:
print(element.get_attribute("innerHTML"))
[/code]

Безрезультатно. Я также пробовал использовать явное и неявное ожидание. Спасибо. 

Подробнее здесь: [url]https://stackoverflow.com/questions/61002365/how-to-use-seleniumbeautifulsoup-to-get-data-from-dynamically-created-elements[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

::CKEDITOR 5 :: Несколько экземпляров для статических и динамически создаваемых элементов div и один редактор

Последнее сообщение Anonymous « 22 сен 2023, 09:21
Добавлено в форуме Jquery

Anonymous » 22 сен 2023, 09:21 » в форуме Jquery

Я использую CKEDITOR 5 Superbuild.

Имея таблицу с несколькими tds с именем класса в виде .text и внутри каждого td, я установил div как true.

Я пытаюсь использовать несколько редакторов на одной странице с одним и тем же классом/атрибутом, и мне...

0 Ответы

63 Просмотры

Последнее сообщение Anonymous
22 сен 2023, 09:21
Событие jQuery «при создании» для динамически создаваемых элементов

Последнее сообщение Гость « 27 фев 2024, 11:28
Добавлено в форуме Jquery

Гость » 27 фев 2024, 11:28 » в форуме Jquery

Мне нужно иметь возможность динамически создавать элемент и превращать его в jQuery .combobox(). Это должно быть событие создания элемента, а не какое-то событие «щелчка», и в этом случае я мог бы просто использовать jQuery .on().

Так существует...

0 Ответы

44 Просмотры

Последнее сообщение Гость
27 фев 2024, 11:28
Стилизация динамически создаваемых столбцов сетки данных wpf с использованием значений из первого столбца

Последнее сообщение Anonymous « 24 сен 2024, 18:17
Добавлено в форуме C#

Anonymous » 24 сен 2024, 18:17 » в форуме C#

У меня есть эта сетка данных. Я динамически генерирую столбцы, отличные от первого столбца, используя следующий код.
var viewModel = (SnapshotViewModel)DataContext;
foreach (var date in OverviewCompViewModel.DateColumns)
{

var column = new...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 18:17
Стилизация динамически создаваемых столбцов сетки данных wpf с использованием значений из первого столбца

Последнее сообщение Anonymous « 25 сен 2024, 02:14
Добавлено в форуме C#

Anonymous » 25 сен 2024, 02:14 » в форуме C#

У меня есть эта сетка данных. Я динамически генерирую столбцы, отличные от первого столбца, используя следующий код.
var viewModel = (SnapshotViewModel)DataContext;
foreach (var date in OverviewCompViewModel.DateColumns)
{

var column = new...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 02:14
Стилизация динамически создаваемых столбцов сетки данных wpf с использованием значений из первого столбца

Последнее сообщение Anonymous « 25 сен 2024, 08:16
Добавлено в форуме C#

Anonymous » 25 сен 2024, 08:16 » в форуме C#

У меня есть эта сетка данных. Я динамически генерирую столбцы, отличные от первого столбца, используя следующий код.
var viewModel = (SnapshotViewModel)DataContext;
foreach (var date in OverviewCompViewModel.DateColumns)
{

var column = new...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 08:16

Вернуться в «Python»