Как узнать все ссылки и имена тегов из файла htmlHtml

Программисты Html
Ответить
Anonymous
 Как узнать все ссылки и имена тегов из файла html

Сообщение Anonymous »

Вот тестовый файл содержит ссылки и имена в example link 1


example link 2


example link 3


Real World Link 

[/code]
Следующая команда может найти все ссылки из файла, но она не может распечатать ссылку и name вместе:
Как лишить все ссылки HTML -файла в Bash или Grep или пакете и хранить их в текстовом файле

Код: Выделить всё

# sed -n 's/.*href="\([^"]*\).*/\1/p' /tmp/test_html.txt
Я хочу, чтобы команда может распечатать все ссылки строки по строке с именем сначала, а затем следуя href .
Вот ожидаемый выход:

Код: Выделить всё

# sed  /tmp/test_html.txt

example link 1 | http://www.example.com/link1
example link 2 | http://www.example.com/link2
example link 3 | http://www.example.com/link3
Real World Link | https://www.example.com/4/0/1/40116601-1FDC-real-world-link/bar
Как написать команду sed ?

Подробнее здесь: https://stackoverflow.com/questions/752 ... -html-file
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»