Например, если я хочу получить имя открытой позиции позиции, он находится в диапазоне с классом «ais-Highlight-nonHighlighted». Я вижу это в своем браузере, но не могу получить эти данные с помощью Python.
HTML-страница при проверке через браузер, показывающая данные для получения (название должности)
Я хочу получить HTML-код веб-страницы, как и запросы, а затем обработать его с помощью BeautifulSoup.
Я пробовал с запросами — html :
Код: Выделить всё
from requests_html import HTMLSession
url = "https://www.lvmh.com/en/join-us/our-job-offers?PRD-en-us-timestamp-desc%5BrefinementList%5D%5Bmaison%5D%5B0%5D=Kendo"
session = HTMLSession()
r = session.get(url)
r.html.render(wait=5)
print(r.html.html)
print(r.html.text)
print(r.text)
job_name = r.html.find('.ais-Highlight-nonHighlighted')
session.close()
Я пробовал с Selenium:< /p>
Код: Выделить всё
from selenium import webdriver
from selenium.webdriver.common.by import By
url = "https://www.lvmh.com/en/join-us/our-job-offers?PRD-en-us-timestamp-desc%5BrefinementList%5D%5Bmaison%5D%5B0%5D=Kendo"
driver = webdriver.Safari()
driver.get(url)
data_source = driver.page_source
data_execute = driver.execute_script("return document.body.innerHTML")
driver.quit()
Ничего не помогло... если кто-нибудь может мне в этом помочь, так и будет будь благодарен.
Подробнее здесь: https://stackoverflow.com/questions/791 ... ith-python