example link 2
example link 3
Real World Link
[/code]
Следующая команда может найти все ссылки из файла, но она не может распечатать ссылку и name вместе:
Как лишить все ссылки HTML -файла в Bash или Grep или пакете и хранить их в текстовом файле
Код: Выделить всё
# sed -n 's/.*href="\([^"]*\).*/\1/p' /tmp/test_html.txt
Вот ожидаемый выход:
Код: Выделить всё
# sed /tmp/test_html.txt
example link 1 | http://www.example.com/link1
example link 2 | http://www.example.com/link2
example link 3 | http://www.example.com/link3
Real World Link | https://www.example.com/4/0/1/40116601-1FDC-real-world-link/bar
Подробнее здесь: https://stackoverflow.com/questions/752 ... -html-file
Мобильная версия