Как извлечь динамически генерируемые ссылки с веб-сайта с помощью Python?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как извлечь динамически генерируемые ссылки с веб-сайта с помощью Python?

Сообщение Anonymous »

Я пишу код, в котором мне нужно получить все ссылки/URL-адреса с определенного веб-сайта, но кажется, что ссылки генерируются динамически и могут заполняться с использованием JavaScript или другого механизма динамической загрузки контента после исходного HTML. извлекается.
Изначально я использовал следующий код:

Код: Выделить всё

import requests
from bs4 import BeautifulSoup

url = 'https://www.example.com/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'html.parser')

urls = []
for link in soup.find_all('a'):
print(link.get('href'))
Однако этот подход не работал, поскольку ссылки не были записаны непосредственно в HTML. Вместо этого они генерируются позже с помощью кода JavaScript. Как я могу извлечь эти динамически генерируемые ссылки?
Буду очень признателен за простую подсказку.

Подробнее здесь: https://stackoverflow.com/questions/786 ... ing-python
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»