Извлечение определенного тега из XML в Python с помощью BeautifulSoup ⇐ Python
-
Гость
Извлечение определенного тега из XML в Python с помощью BeautifulSoup
У меня есть файл метаданных, который выглядит следующим образом:
Princeton Review Digital SAT Premium Prep, 2024 г.: 4 практических теста + онлайн-карточки + обзор и amp; Инструменты Princeton Review 9780593516874 0593516877 63139948 o6i4EAAAQBAJ Я знаю, как использовать BeautifulSoup для извлечения таких полей, как . Я пытаюсь извлечь только поле ISBN ().
из импорта bs4 BeautifulSoup с открытым ('metadata.opf', 'r') как f: файл = f.read() метаданные = BeautifulSoup(файл, 'xml') заголовок = метаданные.find('dc:title') печать(заголовок.текст) автор = метаданные.find('dc:creator') печать(автор.текст) # isbn = метаданные.find_all('dc:identifier'). # Как и ожидалось, найдено 4 поля. Как мне это ограничить? Я не могу зависеть от порядка полей, а длина ISBN может варьироваться.
У меня есть файл метаданных, который выглядит следующим образом:
Princeton Review Digital SAT Premium Prep, 2024 г.: 4 практических теста + онлайн-карточки + обзор и amp; Инструменты Princeton Review 9780593516874 0593516877 63139948 o6i4EAAAQBAJ Я знаю, как использовать BeautifulSoup для извлечения таких полей, как . Я пытаюсь извлечь только поле ISBN ().
из импорта bs4 BeautifulSoup с открытым ('metadata.opf', 'r') как f: файл = f.read() метаданные = BeautifulSoup(файл, 'xml') заголовок = метаданные.find('dc:title') печать(заголовок.текст) автор = метаданные.find('dc:creator') печать(автор.текст) # isbn = метаданные.find_all('dc:identifier'). # Как и ожидалось, найдено 4 поля. Как мне это ограничить? Я не могу зависеть от порядка полей, а длина ISBN может варьироваться.
Мобильная версия