Если у меня есть документ вида:
Код: Выделить всё
Heading
Something here
Something else
Если вы использовали функцию Firefox «Проверить элемент» (просмотр HTML), вы знаете, что она дает вам все теги в хороший вложенный способ, такой как дерево.
Я бы предпочел встроенный модуль, но это может быть слишком много.
Я ответил на множество вопросов о Stack Overflow и нескольких блогах в Интернете, и большинство из них предлагают BeautifulSoup, lxml или HTMLParser, но немногие из них подробно описывают функциональность и просто заканчиваются спором о том, какой из них быстрее/эффективнее.
Подробнее здесь: https://stackoverflow.com/questions/117 ... ing-python
Мобильная версия