Код: Выделить всё
var page = UrlFetchApp.fetch(contestURL);
var doc = XmlService.parse(page);
При использовании приведенный выше код выдает ошибку анализа, однако, если я заменю класс XmlService устаревшим классом Xml с установленным флагом lenient, он правильно анализирует HTML.
Код: Выделить всё
var page = UrlFetchApp.fetch(contestURL);
var doc = Xml.parse(page, true);
Проблема в основном возникает из-за отсутствия CDATA в javascript-части HTML, и синтаксический анализатор выдает следующую ошибку.
Код: Выделить всё
The entity name must immediately follow the '&' in the entity reference.
Даже если я удалю все (.*?) с помощью регулярного выражения, он все равно будет жаловаться, потому что теги
не закрыты.
Есть ли чистый способ анализа html в дереве DOM.
Подробнее здесь:
https://stackoverflow.com/questions/194 ... pps-script