Я хотел бы выполнить парсинг этой веб-страницы, и вот что я сделал, пытаясь найти динамический URL-адрес, который находится за javascipt этой страницы.
Откройте страницу в Google Chrome.
Выберите «Проверить» в контекстном меню.
Перейти в режим «Сеть» tab.
Запускаем получение JavaScript по клавише F5.
Проверьте подвкладку «Fetch/XHR» и найдите «вакансии», у которых есть «Ответ» (дополнительная вкладка), содержащий JSON объявлений о вакансиях.
Откройте указанный выше URL-адрес запроса, в результате чего ответ будет выглядеть следующим образом:
{"errorCode":"HTTP_500","errorCaseId":"E46F9EM40PAYV2","httpStatus":500,"locale":"en-GB,en-U S;q=0.9,en;q=0.8,zh-CN;q=0.7,zh;q=0.6","message":"","messageParams":{}}< /p>
В прошлом мне удавалось, следуя приведенным выше шагам, находить динамические URL-адреса для других веб-страниц. На этой странице (и на многих других) мне, должно быть, чего-то не хватает. Мои вопросы:
Каковы шаги по получению динамического URL-адреса для парсинга упомянутой веб-страницы?
Есть ли подробные руководства по этой теме?
Кстати, я использую PHP и Simple_html_dom, когда выполняю парсинг веб-страниц.
Я хотел бы выполнить парсинг этой веб-страницы, и вот что я сделал, пытаясь найти динамический URL-адрес, который находится за javascipt этой страницы. [list] [*]Откройте страницу в Google Chrome.
[*]Выберите «Проверить» в контекстном меню.
[*]Перейти в режим «Сеть» tab.
[*]Запускаем получение JavaScript по клавише F5.
[*]Проверьте подвкладку «Fetch/XHR» и найдите «вакансии», у которых есть «Ответ» (дополнительная вкладка), содержащий JSON объявлений о вакансиях.
Перейдите в подраздел «Заголовки». вкладка «URL-адрес запроса» — https://cheo.wd10.myworkdayjobs.com/wday/cxs/cheo/External_Site/jobs
[*]Откройте указанный выше URL-адрес запроса, в результате чего ответ будет выглядеть следующим образом: {"errorCode":"HTTP_500","errorCaseId":"E46F9EM40PAYV2","httpStatus":500,"locale":"en-GB,en-U S;q=0.9,en;q=0.8,zh-CN;q=0.7,zh;q=0.6","message":"","messageParams":{}}< /p>
[/list] В прошлом мне удавалось, следуя приведенным выше шагам, находить динамические URL-адреса для других веб-страниц. На этой странице (и на многих других) мне, должно быть, чего-то не хватает. Мои вопросы: [list] [*]Каковы шаги по получению динамического URL-адреса для парсинга упомянутой веб-страницы? [*]Есть ли подробные руководства по этой теме? [/list] Кстати, я использую PHP и Simple_html_dom, когда выполняю парсинг веб-страниц.