Рекурсивный поиск файлов на веб-сайте (Python)

Рекурсивный поиск файлов на веб-сайте (Python) ⇐ Html

1 сообщение • Страница 1 из 1

Anonymous

Рекурсивный поиск файлов на веб-сайте (Python)

Цитата

Сообщение Anonymous » 05 янв 2025, 16:34

Я пытаюсь подтвердить, возможно ли рекурсивно выполнять поиск по веб-сайту, включая ссылки на веб-сайт (подстраницы), и загружать файлы по ссылкам, встроенным в подстраницы. В качестве базового теста я пытаюсь определить, как проверить наличие PDF-файлов на следующем веб-сайте (https://file-examples.com/index.php/sam ... -download/) и иметь возможность загружать эти PDF-файлы по соответствующим ссылкам.
Я чувствую, что это должно быть возможно с использованием запросов и библиотек BeautifulSoup в Python, но, похоже, не могу этого понять. Вот код, который я использую, чтобы попытаться сохранить PDF-файлы локально:
import shutil
from bs4 import BeautifulSoup
import requests
import os
from urllib.parse import urlparse

url = 'https://file-examples.com/index.php/sam ... -download/'
for page in range(2):
r = requests.get(url.format(page))
soup = BeautifulSoup(r.content, "html.parser")
for link in soup.select("h3[class='sv-card-title']>a"):
r = requests.get(link.get("href"), stream=True)
r.raw.decode_content = True
with open(link.text+'.pdf', 'wb') as f:
shutil.copyfileobj(r.raw, f)

Подробнее здесь: https://stackoverflow.com/questions/793 ... ite-python

1736084091

Anonymous

Я пытаюсь подтвердить, возможно ли рекурсивно выполнять поиск по веб-сайту, включая ссылки на веб-сайт (подстраницы), и загружать файлы по ссылкам, встроенным в подстраницы.  В качестве базового теста я пытаюсь определить, как проверить наличие PDF-файлов на следующем веб-сайте (https://file-examples.com/index.php/sample-documents-download/sample-pdf-download/) и иметь возможность загружать эти PDF-файлы по соответствующим ссылкам.
Я чувствую, что это должно быть возможно с использованием запросов и библиотек BeautifulSoup в Python, но, похоже, не могу этого понять.  Вот код, который я использую, чтобы попытаться сохранить PDF-файлы локально:
import shutil
from bs4 import BeautifulSoup
import requests
import os
from urllib.parse import urlparse

url = 'https://file-examples.com/index.php/sample-documents-download/sample-pdf-download/'
for page in range(2):
r = requests.get(url.format(page))
soup = BeautifulSoup(r.content, "html.parser")
for link in soup.select("h3[class='sv-card-title']>a"):
r = requests.get(link.get("href"), stream=True)
r.raw.decode_content = True
with open(link.text+'.pdf', 'wb') as f:
shutil.copyfileobj(r.raw, f)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79327502/recursively-search-files-in-website-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Рекурсивный поиск файлов на веб-сайте (Python)

Последнее сообщение Anonymous « 03 янв 2025, 22:37
Добавлено в форуме Python

Anonymous » 03 янв 2025, 22:37 » в форуме Python

Я пытаюсь подтвердить, возможно ли рекурсивно выполнять поиск по веб-сайту, включая ссылки на веб-сайт (подстраницы), и загружать файлы по ссылкам, встроенным в подстраницы. В качестве базового теста я пытаюсь определить, как проверить наличие...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
03 янв 2025, 22:37
Рекурсивный поиск файлов на веб-сайте (Python) [закрыто]

Последнее сообщение Anonymous « 03 янв 2025, 23:52
Добавлено в форуме Python

Anonymous » 03 янв 2025, 23:52 » в форуме Python

Я пытаюсь подтвердить, возможно ли рекурсивно выполнять поиск по веб-сайту, включая ссылки на веб-сайт (подстраницы), и загружать файлы по ссылкам, встроенным в подстраницы. В качестве базового теста я пытаюсь определить, как проверить наличие...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
03 янв 2025, 23:52
Рекурсивный поиск файлов на веб-сайте (Python) [закрыто]

Последнее сообщение Anonymous « 03 янв 2025, 23:52
Добавлено в форуме Html

Anonymous » 03 янв 2025, 23:52 » в форуме Html

Я пытаюсь подтвердить, возможно ли рекурсивно выполнять поиск по веб-сайту, включая ссылки на веб-сайт (подстраницы), и загружать файлы по ссылкам, встроенным в подстраницы. В качестве базового теста я пытаюсь определить, как проверить наличие...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
03 янв 2025, 23:52
Рекурсивный поиск файлов на веб-сайте (Python)

Последнее сообщение Anonymous « 05 янв 2025, 16:34
Добавлено в форуме Python

Anonymous » 05 янв 2025, 16:34 » в форуме Python

Я пытаюсь подтвердить, возможно ли рекурсивно выполнять поиск по веб-сайту, включая ссылки на веб-сайт (подстраницы), и загружать файлы по ссылкам, встроенным в подстраницы. В качестве базового теста я пытаюсь определить, как проверить наличие...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
05 янв 2025, 16:34
Рекурсивный поиск различий между двумя многомерными массивами со строгой проверкой типов.

Последнее сообщение Anonymous « 15 ноя 2024, 12:01
Добавлено в форуме Php

Anonymous » 15 ноя 2024, 12:01 » в форуме Php

У меня есть 2 массива

$cpe
$sample

Информация о массиве $cpe
array:23 [▼
cpe_mac => 298639133839
bandwidth_max_up => 30000
bandwidth_max_down => 50000
filter_icmp_inbound => true
dmz_enabled => false
dmz_host => http:\/\/ddd.com...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
15 ноя 2024, 12:01

Вернуться в «Html»