..
Identified Header...
[list]
[*][url=links i want][/url]...
[*][url=links i want][/url]...
[*][url=links i want][/url]...
[/list]
..
Я использую код Python для анализа страницы с помощью анализатора lxml. Я могу определить идентификатор указанного элемента с помощью XPath. Но ссылки, к которым мне нужен доступ, не имеют класса/идентификатора для их идентификации, и они также не входят в диапазон идентификатора. Есть ли способ получить доступ к этим ссылкам соседнего элемента? Я попробовал getnext(), но он не может получить доступ к элементам ul и li
Я пытаюсь проанализировать страницу с HTML-кодом, как показано ниже: [code] .. Identified Header... [list] [*][url=links i want][/url]... [*][url=links i want][/url]... [*][url=links i want][/url]... [/list] ..
[/code] Я использую код Python для анализа страницы с помощью анализатора lxml. Я могу определить идентификатор указанного элемента с помощью XPath. Но ссылки, к которым мне нужен доступ, не имеют класса/идентификатора для их идентификации, и они также не входят в диапазон идентификатора. Есть ли способ получить доступ к этим ссылкам соседнего элемента? Я попробовал getnext(), но он не может получить доступ к элементам ul и li
I have a XML and need to remove a few types of tags. I used the iter method to check each element. I noticed if there is a nested element its child is also deleted. The following tag will not be deleted. For example as follows, the tag delete2 is a...
I'm currently using selenium and BeautifulSoup to scrape a website but I'm running into two major issues, first of all, I can't get Chrome to launch in headless mode and it says there are multiple unexpected ends of inputs (photo of said errors)....