Playwright Python не может найти HTML -тег, который появляется в отладчике и в печатном заявлении

Playwright Python не может найти HTML -тег, который появляется в отладчике и в печатном заявлении ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Playwright Python не может найти HTML -тег, который появляется в отладчике и в печатном заявлении

Цитата

Сообщение Anonymous » 20 фев 2025, 10:03

Я пытаюсь очистить страницу сведений о продукте страницы < /p>
Но я не могу найти тег при запуске кода. Я распечатаю родительский тег, и я вижу тег H2 , который я хочу, а также когда я ввожу отладку, я могу получить то, что хочу.

Код: Выделить всё

import time

from bs4 import BeautifulSoup
from playwright.sync_api import sync_playwright

def playwright_get_soup(url, selector_to_wait_for=None, wait_after_page_load=None):
with sync_playwright() as this_playwright:
browser = this_playwright.chromium.launch()
page = browser.new_page()
page.goto(url)
try:
page.wait_for_load_state("load")
if wait_after_page_load:
time.sleep(wait_after_page_load)
except:
pass

if selector_to_wait_for:
page.wait_for_selector(selector_to_wait_for, timeout=15000)

soup = BeautifulSoup(page.content(), "html.parser")
browser.close()
send_readable_formatted_html_dump(soup,
return soup

def parse_product_detail_page(soup):
parent_block = soup.find("div", class_="primary_block")
name_and_id_box = parent_block.find("div", class_="item-box")

print(name_and_id_box) # the h2 tag is visible here

name_and_id_header = name_and_id_box.find("h2", class_="col-xs-6 ")

# import ipdb; ipdb.set_trace() # the h2 tag is also visible here

id_and_raw_name = name_and_id_header.split("#", maxsplit=1) # this is where the program errors out

def scrape_product_detail_page(product_detail_url):
try:
soup = playwright_url_to_soup(product_detail_url, selector_to_wait_for=".item-box")
except:
return None
parsed_data = parse_product_detail_page(soup)
return parsed_data

result = scrape_product_detail_page("https://www.innovation-line.com/four-color-photoimage-products/ventoux-210d-polyester-drawstring-cinch-pack-backpack-907.html")

Я был бы признателен за некоторую помощь определить, почему name_and_id_header продолжает отображаться как ни один. Спасибо

Подробнее здесь: https://stackoverflow.com/questions/794 ... in-a-print

1740034981

Anonymous

 Я пытаюсь очистить страницу сведений о продукте страницы < /p>
Но я не могу найти тег при запуске кода. Я распечатаю родительский тег, и я вижу тег H2 , который я хочу, а также когда я ввожу отладку, я могу получить то, что хочу. 
[code]import time

from bs4 import BeautifulSoup
from playwright.sync_api import sync_playwright

def playwright_get_soup(url, selector_to_wait_for=None, wait_after_page_load=None):
with sync_playwright() as this_playwright:
browser = this_playwright.chromium.launch()
page = browser.new_page()
page.goto(url)
try:
page.wait_for_load_state("load")
if wait_after_page_load:
time.sleep(wait_after_page_load)
except:
pass

if selector_to_wait_for:
page.wait_for_selector(selector_to_wait_for, timeout=15000)

soup = BeautifulSoup(page.content(), "html.parser")
browser.close()
send_readable_formatted_html_dump(soup,
return soup

def parse_product_detail_page(soup):
parent_block = soup.find("div", class_="primary_block")
name_and_id_box = parent_block.find("div", class_="item-box")

print(name_and_id_box) # the h2 tag is visible here

name_and_id_header = name_and_id_box.find("h2", class_="col-xs-6 ")

# import ipdb; ipdb.set_trace() # the h2 tag is also visible here

id_and_raw_name = name_and_id_header.split("#", maxsplit=1) # this is where the program errors out

def scrape_product_detail_page(product_detail_url):
try:
soup = playwright_url_to_soup(product_detail_url, selector_to_wait_for=".item-box")
except:
return None
parsed_data = parse_product_detail_page(soup)
return parsed_data

result = scrape_product_detail_page("https://www.innovation-line.com/four-color-photoimage-products/ventoux-210d-polyester-drawstring-cinch-pack-backpack-907.html")
[/code]
Я был бы признателен за некоторую помощь определить, почему name_and_id_header  продолжает отображаться как ни один. Спасибо  

Подробнее здесь: [url]https://stackoverflow.com/questions/79452261/playwright-python-cant-find-html-tag-which-shows-up-in-debugger-and-in-a-print[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Playwright Python не может найти HTML -тег, который появляется в отладчике и в печатном заявлении

Последнее сообщение Anonymous « 20 фев 2025, 17:23
Добавлено в форуме Python

Anonymous » 20 фев 2025, 17:23 » в форуме Python

Я пытаюсь очистить страницу сведений о продукте страницы
Но я не могу найти тег при запуске кода. Я распечатаю родительский тег, и я вижу тег H2 , который я хочу, а также когда я ввожу отладку, я могу получить то, что хочу.
import time

from bs4...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 17:23
Playwright Python не может найти HTML -тег, который появляется в отладчике и в печатном заявлении

Последнее сообщение Anonymous « 22 фев 2025, 01:59
Добавлено в форуме Python

Anonymous » 22 фев 2025, 01:59 » в форуме Python

Я пытаюсь очистить страницу сведений о продукте страницы
Но я не могу найти тег при запуске кода. Я распечатаю родительский тег, и я вижу тег H2 , который я хочу, а также когда я ввожу отладку, я могу получить то, что хочу.
import time

from bs4...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
22 фев 2025, 01:59
Растянуть или уменьшить изображение вертикально, чтобы заполнить страницу в печатном HTML

Последнее сообщение Anonymous « 16 май 2025, 15:40
Добавлено в форуме CSS

Anonymous » 16 май 2025, 15:40 » в форуме CSS

(это похоже на уменьшение изображения, чтобы заполнить оставшееся пространство на странице горизонтально, но вертикально и без гибкого .)
Рассмотрим HTML -страницу, как ниже. Когда это напечатано, каждая статья начинается на новой странице. Чтобы...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
16 май 2025, 15:40
Как добавить тег x509Data и тег keyInfo в тег «Тема» в saml2

Последнее сообщение Anonymous « 17 окт 2024, 03:30
Добавлено в форуме JAVA

Anonymous » 17 окт 2024, 03:30 » в форуме JAVA

Я использую следующий код для создания приведенного ниже утверждения Saml:

SAMLObjectBuilder confirmationMethodBuilder = (SAMLObjectBuilder) builderFactory.getBuilder(SubjectConfirmationData.DEFAULT_ELEMENT_NAME);
SubjectConfirmationData...

0 Ответы

72 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 03:30
Что означает [-2] в печатном виде? [дубликат]

Последнее сообщение Anonymous « 19 окт 2023, 09:53
Добавлено в форуме Python

Anonymous » 19 окт 2023, 09:53 » в форуме Python

`if __name__ == '__main__': n = целое число (вход()) arr = карта(int, input().split()) list_arr = список (прибытие) новый_список = [] для меня в list_arr: если меня нет в new_list: new_list.append(я) print(sorted(new_list) )` Это код, который я...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 09:53

Вернуться в «Python»