Мне нужно собирать ссылки на файлы PDF (программа курса) с университетских сайтов. У меня есть большой список базовых доменов, таких как:
[*]https://university-a.com
[*]http://www.institute-du> />https://edu-c.example.org> />cabinet.institute-b.edu ;
[*] info.edu-c.example.org> Пробое: < /p>
Поиск через Bing и Duckduckgo < /h2>
Я сформировал запросы, такие как: < /p>
Код: Выделить всё
query
Что я хочу понять: < /h1>
Есть ли надежный способ поиска и извлечения ссылок PDF из доменов и их субдомен: < /p>
без нажатия Captcha или < /p>
. или
Использование поисковых систем вообще?>
Подробнее здесь: [url]https://stackoverflow.com/questions/79603791/how-to-scrape-pdf-files-from-the-list-of-websites-and-subdomains-without-hitting[/url]