Я могу получить заголовки, используя:
Код: Выделить всё
titles = soup.findAll('title')
Это часть файла tei.xml, который является выходными данными Grobid:
Код: Выделить всё
GROBID - A machine learning software for extracting information from scholarly documents
The Role of Artificial Intelligence in Software Engineering
MarkHarman
CREST Centre
University College London
Malet Place
WC1E 6BT
London
UK
The Role of Artificial Intelligence in Software Engineering
Подробнее здесь: https://stackoverflow.com/questions/525 ... tiful-soup