Пытаюсь очистить веб-сайт с помощью Selenium Python, но не могу найти элементы таблицы.

Пытаюсь очистить веб-сайт с помощью Selenium Python, но не могу найти элементы таблицы. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Пытаюсь очистить веб-сайт с помощью Selenium Python, но не могу найти элементы таблицы.

Цитата

Сообщение Anonymous » 06 ноя 2024, 21:09

Я пытаюсь изучить Python, и одна из вещей, которые мне действительно кажутся крутыми, — это удаление данных веб-сайта. Я наткнулся на несколько веб-сайтов, на которых мне удалось легко извлечь данные из таблиц, но этот не возвращает никаких результатов, когда я проверяю, сколько элементов возвращается - https://www.nyse.com/ipo-center/recent-ipo .
Буду рад любой обратной связи, так как я только начинаю программировать на Python, и это всего лишь один веб-сайт, на который я наткнулся, и когда я попробовал, он не сработал.Вот мой код с сайта попытка:

Код: Выделить всё

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
from selenium.webdriver import ChromeOptions

options = ChromeOptions()
options.add_argument("--headless=new")
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)

driver.get("https://www.nyse.com/ipo-center/recent-ipo")

print(len(driver.find_elements(By.XPATH,      "/html/body/div[1]/div[4]/div[2]/div[3]/div[1]/div[4]/table/tbody/tr[1]/td[1]")))

driver.quit()

Вот результат:
c:.../pythonProject/.venv/webscrapper.py
DevTools прослушивает ws://127.0.0.1:56919/devtools/browser/65057eec-4e00-4936-abde-62df4be67eea
0
В режиме проверки для Chrome я вижу один результат, полученный, когда я попробовал тот же XPath из браузера:
введите здесь описание изображения
Я тестировал сократив XPath до этого:
print(len(driver.find_elements(By.XPATH, "/html/body/div[1]/div[4]/div[2]/ div[3]/div[1]/div[4]/table/tbody")))
и это возвращает 1 правильный результат:
c:.../pythonProject/.venv/webscrapper.py
DevTools прослушивает ws://127.0.0.1:57482/devtools/browser/dfe58545-8271-4278 -95a2-ee423b7c6103
1
Я думаю, что на этом веб-сайте происходит что-то дополнительное, что не позволяет мне парсить, или я это делаю что-то правильно. Может кто-нибудь помочь мне с этим, пожалуйста? Есть ли лучший способ закодировать это?

Подробнее здесь: https://stackoverflow.com/questions/791 ... ind-the-el

1730916559

Anonymous

Я пытаюсь изучить Python, и одна из вещей, которые мне действительно кажутся крутыми, — это удаление данных веб-сайта. Я наткнулся на несколько веб-сайтов, на которых мне удалось легко извлечь данные из таблиц, но этот не возвращает никаких результатов, когда я проверяю, сколько элементов возвращается - https://www.nyse.com/ipo-center/recent-ipo .
Буду рад любой обратной связи, так как я только начинаю программировать на Python, и это всего лишь один веб-сайт, на который я наткнулся, и когда я попробовал, он не сработал.Вот мой код с сайта попытка:
[code]from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
from selenium.webdriver import ChromeOptions

options = ChromeOptions()
options.add_argument("--headless=new")
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)

driver.get("https://www.nyse.com/ipo-center/recent-ipo")

print(len(driver.find_elements(By.XPATH,      "/html/body/div[1]/div[4]/div[2]/div[3]/div[1]/div[4]/table/tbody/tr[1]/td[1]")))

driver.quit()
[/code]
Вот результат:
c:.../pythonProject/.venv/webscrapper.py
DevTools прослушивает ws://127.0.0.1:56919/devtools/browser/65057eec-4e00-4936-abde-62df4be67eea
0
В режиме проверки для Chrome я вижу один результат, полученный, когда я попробовал тот же XPath из браузера:
введите здесь описание изображения
Я тестировал сократив XPath до этого:
print(len(driver.find_elements(By.XPATH, "/html/body/div[1]/div[4]/div[2]/ div[3]/div[1]/div[4]/table/tbody")))
и это возвращает 1 правильный результат:
c:.../pythonProject/.venv/webscrapper.py
DevTools прослушивает ws://127.0.0.1:57482/devtools/browser/dfe58545-8271-4278 -95a2-ee423b7c6103
1
Я думаю, что на этом веб-сайте происходит что-то дополнительное, что не позволяет мне парсить, или я это делаю что-то правильно. Может кто-нибудь помочь мне с этим, пожалуйста? Есть ли лучший способ закодировать это? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79163767/trying-to-scrape-a-website-with-selenium-python-and-i-am-not-able-to-find-the-el[/url]