Как разобрать HTML веб-сайта с помощью PowerShellHtml

Программисты Html
Ответить
Anonymous
 Как разобрать HTML веб-сайта с помощью PowerShell

Сообщение Anonymous »

Я пытаюсь получить некоторую информацию о веб-сайте, хочу найти определенный тег/класс, а затем вернуть содержащееся текстовое значение (innerHTML). Это то, что у меня есть на данный момент

Код: Выделить всё

$request = Invoke-WebRequest -Uri $url -UseBasicParsing
$HTML = New-Object -Com "HTMLFile"
$src = $request.RawContent
$HTML.write($src)

foreach ($obj in $HTML.all) {
$obj.getElementsByClassName('some-class-name')
}
Я думаю, что существует проблема с преобразованием HTML в объект HTML, поскольку я вижу множество неопределенных свойств и пустых результатов, когда пытаюсь их «Выбрать-Объектировать».

Итак, потратив два дня, как я должен анализировать HTML с помощью Powershell?
  • Я не могу использовать методы IHTMLDocument2, так как у меня не установлен Office (невозможно использовать IHTMLDocument2)
  • Я не могу использовать Invoke-Webrequest без -UseBasicParsing, поскольку Powershell зависает и создает дополнительные окна при доступе к свойству ParsedHTML (parsedhtml больше не отвечает, а использование Invoke-Webrequest в PowerShell 3.0 порождает предупреждение безопасности Windows)
Итак, поскольку синтаксический анализ HTML с помощью регулярных выражений является таким большим запретом, как мне поступить иначе? Кажется, ничего не работает.

Подробнее здесь: https://stackoverflow.com/questions/568 ... powershell
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»