Парсинг HTML с использованием PythonPython

Программы на Python
Ответить
Anonymous
 Парсинг HTML с использованием Python

Сообщение Anonymous »

Я ищу модуль HTML Parser для Python, который поможет мне получить теги в виде списков/словарей/объектов Python.
Если у меня есть документ вида:

Код: Выделить всё

Heading


Something here
Something else



тогда он должен дать мне возможность получить доступ к вложенным тегам через имя или идентификатор тега HTML, чтобы я мог просто попросить его получить содержимое/текст в теге div с class='container', содержащимся в теге body, или что-то подобное.
Если вы использовали функцию Firefox «Проверить элемент» (просмотр HTML), вы знаете, что она дает вам все теги в хороший вложенный способ, такой как дерево.
Я бы предпочел встроенный модуль, но это может быть слишком много.

Я ответил на множество вопросов о Stack Overflow и нескольких блогах в Интернете, и большинство из них предлагают BeautifulSoup, lxml или HTMLParser, но немногие из них подробно описывают функциональность и просто заканчиваются спором о том, какой из них быстрее/эффективнее.

Подробнее здесь: https://stackoverflow.com/questions/117 ... ing-python
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»