Код: Выделить всё
import requests
from bs4 import BeautifulSoup
import re
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get('https://www.fxstreet.com/news?q=&hPP=17&idx=FxsIndexPro&p=0')
article = driver.find_element_by_link_text('/news')
for post in article:
print(post.text)
Однако, когда я пытаюсь найти тег hrefs/'a', я получаю много ссылок по всему веб-сайту, но ни одна из них не является новостью. статьи, представленные в прямом эфире. Когда я просматриваю каждый элемент div, я получаю весь HTML-код:
Код: Выделить всё
[url=https://www.fxstreet.com/news/gbp-usd-upside-potential-limited-in-covid-19-uncertainties-202004021808]GBP/USD upside potential limited in COVID-19 uncertainties[/url]
[url=/author/ross-j-burland]Ross J Burland[/url]
| 18:08 GMT
Код: Выделить всё
elem = driver.find_elements_partial_link("news")
for element in elem:
print(element.get_attribute("innerHTML"))
Подробнее здесь: https://stackoverflow.com/questions/610 ... d-elements