Как вы используете BeautifulSoup и Selenium, чтобы скрепить HTML внутри Shadow Dom? - Цифровое Кемерово

Как вы используете BeautifulSoup и Selenium, чтобы скрепить HTML внутри Shadow Dom? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как вы используете BeautifulSoup и Selenium, чтобы скрепить HTML внутри Shadow Dom?

Цитата

Сообщение Anonymous » 18 апр 2025, 14:02

Я пытаюсь сделать программу автоматизации, чтобы соскребить часть веб -сайта. Но этот веб -сайт изготовлен из JavaScript, а часть веб -сайта, которую я хочу скрепить, находится в теневой доме.def expand_shadow_element(element):
shadow_root = driver.execute_script('return arguments[0].shadowRoot', element)
return shadow_root
< /code>
и используйте < /p>
driver.page_source
< /code>
Чтобы получить HTML этого веб -сайта. Но этот код не показывает мне элементы, которые находятся внутри Shadow Dom. < /P>
Я попытался объединить эти два и попробовал < /p>
root1 = driver.find_element(By. CSS_SELECTOR, "path1")
shadow_root = expand_shadow_element(root1)
html = shadow_root.page_source
< /code>
Но я получил < /p>
AttributeError: 'ShadowRoot' object has no attribute 'page_source'
< /code>
для ответа. Поэтому я думаю, что мне нужно использовать BeautifulSoup, чтобы очистить данные с этой страницы, но я не могу понять, как комбинировать BeautifulSoup и Selenium, чтобы очистить данные из Shadow Dom. < /P>

p.s. Если часть, которую я хочу скрепить, < /p>
apple
1$
red
< /code>
Я хочу точно очистить этот код, а не < /p>
apple
1$
red

Подробнее здесь: https://stackoverflow.com/questions/742 ... shadow-dom

Реклама

1744974120

Anonymous

 Я пытаюсь сделать программу автоматизации, чтобы соскребить часть веб -сайта. Но этот веб -сайт изготовлен из JavaScript, а часть веб -сайта, которую я хочу скрепить, находится в теневой доме.def expand_shadow_element(element):
shadow_root = driver.execute_script('return arguments[0].shadowRoot', element)
return shadow_root
< /code>
и используйте < /p>
driver.page_source
< /code>
Чтобы получить HTML этого веб -сайта. Но этот код не показывает мне элементы, которые находятся внутри Shadow Dom. < /P>
Я попытался объединить эти два и попробовал < /p>
root1 = driver.find_element(By. CSS_SELECTOR, "path1")
shadow_root = expand_shadow_element(root1)
html = shadow_root.page_source
< /code>
Но я получил < /p>
AttributeError: 'ShadowRoot' object has no attribute 'page_source'
< /code>
для ответа. Поэтому я думаю, что мне нужно использовать BeautifulSoup, чтобы очистить данные с этой страницы, но я не могу понять, как комбинировать BeautifulSoup и Selenium, чтобы очистить данные из Shadow Dom. < /P>

p.s. Если часть, которую я хочу скрепить, < /p>
apple
1$
red
< /code>
Я хочу точно очистить этот код, а не < /p>
apple
1$
red
 

Подробнее здесь: [url]https://stackoverflow.com/questions/74252734/how-do-you-use-beautifulsoup-and-selenium-to-scrape-html-inside-shadow-dom[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как обрабатывать элементы внутри Shadow DOM из Selenium

Последнее сообщение Anonymous « 29 окт 2023, 07:34
Добавлено в форуме Python

Anonymous » 29 окт 2023, 07:34 » в форуме Python

Я хочу автоматизировать проверку завершения загрузки файлов в chromedriver. HTML каждой записи в списке загрузок выглядит как

ЗагруженныйФайл#1 Поэтому я использую следующий код для поиска целевых элементов:

driver.get('chrome://downloads/') #...

0 Ответы

64 Просмотры

Последнее сообщение Anonymous
29 окт 2023, 07:34
Считается ли вызов функций манипуляции с DOM из модуля DOM.JS в модулях index.js как логика и разлука DOM?

Последнее сообщение Anonymous « 01 апр 2025, 21:45
Добавлено в форуме Javascript

Anonymous » 01 апр 2025, 21:45 » в форуме Javascript

Я работаю над проектом Game Battleship Game и хотел получить некоторый отзыв о моем подходе к разделению игровой логики и манипуляции с DOM. Текущее состояние игры.
манипуляции с DOM (рендерингом платы, обновления ячеек и т. Д.) Обработается...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
01 апр 2025, 21:45
Есть ли причина использовать css box-shadow вместо drop-shadow?

Последнее сообщение Anonymous « 23 янв 2025, 15:48
Добавлено в форуме CSS

Anonymous » 23 янв 2025, 15:48 » в форуме CSS

Предполагая совместимость клиента, существует ли ситуация, когда CSS box-shadow предпочтительнее фильтровать: drop-shadow.

Из В статье похоже, что drop-shadow — это расширенная версия box-shadow с аппаратным ускорением. Это означает, что нам всегда...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
23 янв 2025, 15:48
HTML-элемент видео не прикрепляется к iOS Shadow DOM

Последнее сообщение Гость « 30 сен 2023, 16:35
Добавлено в форуме IOS

Гость » 30 сен 2023, 16:35 » в форуме IOS

Я встроил потоки с камеры в свое веб-приложение react (используя библиотеку go2rtc) внутри прокручиваемого элемента div со следующей структурой:

// поток 1 // поток 2 ... // скоро Я заметил, что при просмотре на iOS с использованием приложений...

0 Ответы

40 Просмотры

Последнее сообщение Гость
30 сен 2023, 16:35
Можем ли мы гнездясь теги внутри
, используя трюки Shadow Dom или Iframe?

Последнее сообщение Anonymous « 18 июн 2025, 15:58
Добавлено в форуме Html

Anonymous » 18 июн 2025, 15:58 » в форуме Html

Обычно теги и определяют корневую структуру документа HTML и не позволяют появляться внутри других тегов, таких как .
Но я задаюсь вопросом:
это возможно , и - внутри на родительской странице?attachShadow({ mode: 'open' }) )
внедрение с...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
18 июн 2025, 15:58

Вернуться в «Python»

Programmiererforum