HTML getnext с использованием парсера lxml

HTML getnext с использованием парсера lxml ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

HTML getnext с использованием парсера lxml

Цитата

Сообщение Anonymous » 25 май 2024, 03:13

Я пытаюсь проанализировать страницу с HTML-кодом, как показано ниже:

Код: Выделить всё

..
Identified Header...
[list]
[*][url=links i want][/url]...
[*][url=links i want][/url]...
[*][url=links i want][/url]...
[/list]
..

Я использую код Python для анализа страницы с помощью анализатора lxml. Я могу определить идентификатор указанного элемента с помощью XPath. Но ссылки, к которым мне нужен доступ, не имеют класса/идентификатора для их идентификации, и они также не входят в диапазон идентификатора. Есть ли способ получить доступ к этим ссылкам соседнего элемента? Я попробовал getnext(), но он не может получить доступ к элементам ul и li

Подробнее здесь: https://stackoverflow.com/questions/215 ... xml-parser

1716595981

Anonymous

Я пытаюсь проанализировать страницу с HTML-кодом, как показано ниже:
[code]
..
Identified Header...
[list]
[*][url=links i want][/url]...
[*][url=links i want][/url]...
[*][url=links i want][/url]...
[/list]
..

[/code]
Я использую код Python для анализа страницы с помощью анализатора lxml. Я могу определить идентификатор указанного элемента с помощью XPath. Но ссылки, к которым мне нужен доступ, не имеют класса/идентификатора для их идентификации, и они также не входят в диапазон идентификатора. Есть ли способ получить доступ к этим ссылкам соседнего элемента? Я попробовал getnext(), но он не может получить доступ к элементам ul и li
 

Подробнее здесь: [url]https://stackoverflow.com/questions/21551266/html-getnext-using-lxml-parser[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Python lxml.html.parse не читает URL-адрес – или как получить request.get в lxml.html.dom?

Последнее сообщение Anonymous « 09 май 2024, 19:44
Добавлено в форуме Python

Anonymous » 09 май 2024, 19:44 » в форуме Python

Приведенный ниже код работает для многих веб-страниц, но для некоторых, подобных приведенному ниже, он выдает ошибку:

Ошибка: ошибка чтения файла
/>'
не удалось загрузить HTTP-ресурс

Python для воспроизведения:
from lxml.html import parse
import...

0 Ответы

98 Просмотры

Последнее сообщение Anonymous
09 май 2024, 19:44
Python lxml.html SyntaxError: неверный предикат с XPath при использовании LXML Найти [дубликат]

Последнее сообщение Anonymous « 20 фев 2025, 19:56
Добавлено в форуме Python

Anonymous » 20 фев 2025, 19:56 » в форуме Python

Я использую CPYTHON 3.12.6, LXML 5.3.1, Windows 11 Pro 23H2 x64.
Следующий код Python повышает исключение:
tree.find( .//table //tr )

SyntaxError: invalid predicate

Interestingly the following works:
tree.xpath( .//table //tr )

Why?
I am...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 19:56
Python lxml.html SyntaxError: неверный предикат с XPath при использовании LXML

Последнее сообщение Anonymous « 20 фев 2025, 20:46
Добавлено в форуме Python

Anonymous » 20 фев 2025, 20:46 » в форуме Python

Я использую CPYTHON 3.12.6, LXML 5.3.1, Windows 11 Pro 23H2 x64.
Следующий код Python повышает исключение:
tree.find( .//table //tr )

SyntaxError: invalid predicate

Interestingly the following works:
tree.xpath( .//table //tr )

Why?
I am...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 20:46
Удаление тега lxml – неожиданный результат при использовании удаления lxml [дубликат]

Последнее сообщение Гость « 02 мар 2024, 12:47
Добавлено в форуме Python

Гость » 02 мар 2024, 12:47 » в форуме Python

I have a XML and need to remove a few types of tags. I used the iter method to check each element. I noticed if there is a nested element its child is also deleted. The following tag will not be deleted. For example as follows, the tag delete2 is a...

0 Ответы

65 Просмотры

Последнее сообщение Гость
02 мар 2024, 12:47
Безголовая строка парсера Chrome и HTML

Последнее сообщение Гость « 07 мар 2024, 13:37
Добавлено в форуме Python

Гость » 07 мар 2024, 13:37 » в форуме Python

I'm currently using selenium and BeautifulSoup to scrape a website but I'm running into two major issues, first of all, I can't get Chrome to launch in headless mode and it says there are multiple unexpected ends of inputs (photo of said errors)....

0 Ответы

14 Просмотры

Последнее сообщение Гость
07 мар 2024, 13:37

Вернуться в «Python»