Буду рад любой обратной связи, так как я только начинаю программировать на Python, и это всего лишь один веб-сайт, на который я наткнулся, и когда я попробовал, он не сработал.Вот мой код с сайта попытка:
Код: Выделить всё
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
from selenium.webdriver import ChromeOptions
options = ChromeOptions()
options.add_argument("--headless=new")
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)
driver.get("https://www.nyse.com/ipo-center/recent-ipo")
print(len(driver.find_elements(By.XPATH, "/html/body/div[1]/div[4]/div[2]/div[3]/div[1]/div[4]/table/tbody/tr[1]/td[1]")))
driver.quit()
c:.../pythonProject/.venv/webscrapper.py
DevTools прослушивает ws://127.0.0.1:56919/devtools/browser/65057eec-4e00-4936-abde-62df4be67eea
0
В режиме проверки для Chrome я вижу один результат, полученный, когда я попробовал тот же XPath из браузера:
введите здесь описание изображения
Я тестировал сократив XPath до этого:
print(len(driver.find_elements(By.XPATH, "/html/body/div[1]/div[4]/div[2]/ div[3]/div[1]/div[4]/table/tbody")))
и это возвращает 1 правильный результат:
c:.../pythonProject/.venv/webscrapper.py
DevTools прослушивает ws://127.0.0.1:57482/devtools/browser/dfe58545-8271-4278 -95a2-ee423b7c6103
1
Я думаю, что на этом веб-сайте происходит что-то дополнительное, что не позволяет мне парсить, или я это делаю что-то правильно. Может кто-нибудь помочь мне с этим, пожалуйста? Есть ли лучший способ закодировать это?
Подробнее здесь: https://stackoverflow.com/questions/791 ... ind-the-el