Как извлечь динамически генерируемые ссылки с веб-сайта с помощью Python? - Цифровое Кемерово

Как извлечь динамически генерируемые ссылки с веб-сайта с помощью Python? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как извлечь динамически генерируемые ссылки с веб-сайта с помощью Python?

Цитата

Сообщение Anonymous » 01 июл 2024, 22:53

Я пишу код, в котором мне нужно получить все ссылки/URL-адреса с определенного веб-сайта, но кажется, что ссылки генерируются динамически и могут заполняться с использованием JavaScript или другого механизма динамической загрузки контента после исходного HTML. извлекается.
Изначально я использовал следующий код:

Код: Выделить всё

import requests
from bs4 import BeautifulSoup

url = 'https://www.example.com/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'html.parser')

urls = []
for link in soup.find_all('a'):
print(link.get('href'))

Однако этот подход не работал, поскольку ссылки не были записаны непосредственно в HTML. Вместо этого они генерируются позже с помощью кода JavaScript. Как я могу извлечь эти динамически генерируемые ссылки?
Буду очень признателен за простую подсказку.

Подробнее здесь: https://stackoverflow.com/questions/786 ... ing-python

Реклама

1719863606

Anonymous

Я пишу код, в котором мне нужно получить все ссылки/URL-адреса с определенного веб-сайта, но кажется, что ссылки генерируются динамически и могут заполняться с использованием JavaScript или другого механизма динамической загрузки контента после исходного HTML. извлекается.
Изначально я использовал следующий код:
[code]import requests
from bs4 import BeautifulSoup

url = 'https://www.example.com/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'html.parser')

urls = []
for link in soup.find_all('a'):
print(link.get('href'))
[/code]
Однако этот подход не работал, поскольку ссылки не были записаны непосредственно в HTML. Вместо этого они генерируются позже с помощью кода JavaScript. Как я могу извлечь эти динамически генерируемые ссылки?
Буду очень признателен за простую подсказку. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78692798/how-to-extract-dynamically-generated-links-from-a-website-using-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибки после нацеливания на динамически генерируемые веб-элементы с использованием операторов XPATH.

Последнее сообщение Anonymous « 04 мар 2024, 10:56
Добавлено в форуме Python

Anonymous » 04 мар 2024, 10:56 » в форуме Python

As the subject mentions I'm having trouble when targeting a web element using XPATH statements. Upon initial startup of my program, the script will work for a hundreds of entries using information retrieved from a separate file. The problem arises...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
04 мар 2024, 10:56
Python/Selenium: динамически генерируемые элементы с одинаковым URL-адресом – html не реагирует на нажатие

Последнее сообщение Anonymous « 28 ноя 2024, 04:38
Добавлено в форуме Python

Anonymous » 28 ноя 2024, 04:38 » в форуме Python

Я новичок в веб-скрапинге и, возможно, уже запутался в этом вопросе, но я пытаюсь получить информацию о квартирах с динамически генерируемого веб-сайта ( Я добрался до того, что смог собрать нужную мне информацию по «общему» URL-адресу (по умолчанию...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
28 ноя 2024, 04:38
Python/Selenium: динамически генерируемые элементы с одинаковым URL-адресом – html не реагирует на нажатие

Последнее сообщение Anonymous « 28 ноя 2024, 05:18
Добавлено в форуме Python

Anonymous » 28 ноя 2024, 05:18 » в форуме Python

Я новичок в веб-скрапинге и, возможно, уже запутался в этом вопросе, но я пытаюсь получить информацию о квартирах с динамически генерируемого веб-сайта ( Я добрался до того, что смог собрать нужную мне информацию по «общему» URL-адресу (по умолчанию...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
28 ноя 2024, 05:18
Динамически генерируемые нулевые значения JSONObject преобразуются в строку после сохранения и получения ее из базы данн

Последнее сообщение Anonymous « 03 мар 2024, 08:07
Добавлено в форуме JAVA

Anonymous » 03 мар 2024, 08:07 » в форуме JAVA

I am getting a JSON object from google maps and saving to MySQL DB using JdbcTemplate in a longBLOB data type. The format of JSON before saving is:-

{ circle_bound : , count_values : , query_shapes : , query_type : , total_count :1, total_points...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
03 мар 2024, 08:07
PHP 8, как кратко увеличивать динамически генерируемые переменные

Последнее сообщение Anonymous « 14 май 2024, 18:03
Добавлено в форуме Php

Anonymous » 14 май 2024, 18:03 » в форуме Php

PHP 8 превратил уведомление в предупреждение о том, что ведется работа над неустановленной переменной.
PHP 7.4:
// Below would create a variable and set it to 0 + 1
// Below would generate a Notice level error.
$_SESSION ++;

PHP 8+:
// Below...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
14 май 2024, 18:03

Вернуться в «Python»

Programmiererforum