Python: очистка ссылок с нескольких URL-адресов

Python: очистка ссылок с нескольких URL-адресов ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Python: очистка ссылок с нескольких URL-адресов

Цитата

Сообщение Anonymous » 05 июл 2024, 07:36

Я пытаюсь адаптировать следующий код для очистки ссылок с различных страниц, например. если на 1 странице 40 ссылок, я ожидаю получить 400 ссылок на 10 страниц.
Веб-страницы следуют следующему шаблону:
htt ps:// www.examples.com/user/username#page1-videos («1» в «page1» — это изменяющийся элемент).
Ссылки на веб-странице следуют следующему шаблону:
htt ps://www.example.com/video/1423061
У меня есть несколько вопросов:

Исходный код относится к «name_list» и «link_list». Мне не нужен столбец «name» в окончательном CSV-файле, только 1 столбец (т. е. URL-адреса). Я попытался просто удалить все, что связано с name_list, но df оказался пустым. Как это исправить?
Я хочу поместить все URL-адреса, которые нужно скопировать, в файл .txt и выполнить итерацию кода по каждому из них. строка в txt. Как мне это сделать?

Код: Выделить всё

import requests
from bs4 import BeautifulSoup
import pandas as pd
i=0
name_list =[]
link_list = []
while(i

Подробнее здесь: [url]https://stackoverflow.com/questions/78709420/python-scraping-links-from-multiple-urls[/url]

1720154168

Anonymous

Я пытаюсь адаптировать следующий код для очистки ссылок с различных страниц, например. если на 1 странице 40 ссылок, я ожидаю получить 400 ссылок на 10 страниц.
Веб-страницы следуют следующему шаблону:
htt ps:// www.examples.com/user/username#page1-videos («1» в «page1» — это изменяющийся элемент).
Ссылки на веб-странице следуют следующему шаблону:
htt ps://www.example.com/video/1423061
У меня есть несколько вопросов:
[list]
[*]Исходный код относится к «name_list» и «link_list». Мне не нужен столбец «name» в окончательном CSV-файле, только 1 столбец (т. е. URL-адреса). Я попытался просто удалить все, что связано с name_list, но df оказался пустым. Как это исправить?

[*]Я хочу поместить все URL-адреса, которые нужно скопировать, в файл .txt и выполнить итерацию кода по каждому из них. строка в txt. Как мне это сделать?

[/list]
[code]import requests
from bs4 import BeautifulSoup
import pandas as pd
i=0
name_list =[]
link_list = []
while(i

Подробнее здесь: [url]https://stackoverflow.com/questions/78709420/python-scraping-links-from-multiple-urls[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как перенаправить одну структуру URL-адресов на другую структуру URL-адресов?

Последнее сообщение Anonymous « 08 дек 2023, 12:30
Добавлено в форуме Php

Anonymous » 08 дек 2023, 12:30 » в форуме Php

Мне нужна помощь с правилом перенаправления htaccess. У меня есть тысячи URL со структурой

который необходимо перенаправить на Но вообще не следует перенаправлять.

Есть ли какое-либо правило или способ добиться этого?

0 Ответы

134 Просмотры

Последнее сообщение Anonymous
08 дек 2023, 12:30
Как перенаправить одну структуру URL-адресов на другую структуру URL-адресов?

Последнее сообщение Anonymous « 08 дек 2023, 12:30
Добавлено в форуме Apache

Anonymous » 08 дек 2023, 12:30 » в форуме Apache

Мне нужна помощь с правилом перенаправления htaccess. У меня есть тысячи URL со структурой

который необходимо перенаправить на Но вообще не следует перенаправлять.

Есть ли какое-либо правило или способ добиться этого?

0 Ответы

155 Просмотры

Последнее сообщение Anonymous
08 дек 2023, 12:30
Как переопределить обработку URL-адресов в CEFSharp без изменения исходных URL-адресов запроса?

Последнее сообщение Anonymous « 21 июн 2024, 03:10
Добавлено в форуме C#

Anonymous » 21 июн 2024, 03:10 » в форуме C#

Я пытаюсь создать прокси-браузер с помощью браузера CEFSharp, что предполагает изменение URL-адреса с на . Однако это изменение URL-адреса меняет домен и вызывает проблемы с политикой безопасности контента (CSP) и веб-сайтами, которые дважды...

0 Ответы

63 Просмотры

Последнее сообщение Anonymous
21 июн 2024, 03:10
Как я могу использовать App.config для хранения URL-адресов и получения URL-адресов при тестировании тестов Selenium с п

Последнее сообщение Anonymous « 31 июл 2024, 12:29
Добавлено в форуме C#

Anonymous » 31 июл 2024, 12:29 » в форуме C#

Я создал файл App.config для хранения URL-адресов вместо того, чтобы жестко запрограммировать их во время моих модульных тестов, поэтому, если URL-адрес изменится, у меня есть только одно место, где мне нужно их изменить. Это мой App.config...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
31 июл 2024, 12:29
Как я могу использовать App.config для хранения URL-адресов и получения URL-адресов при тестировании тестов Selenium с п

Последнее сообщение Anonymous « 31 июл 2024, 20:10
Добавлено в форуме C#

Anonymous » 31 июл 2024, 20:10 » в форуме C#

Я создал файл App.config для хранения URL-адресов вместо того, чтобы жестко запрограммировать их во время моих модульных тестов, поэтому, если URL-адрес изменится, у меня есть только одно место, где мне нужно их изменить. Это мой App.config...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
31 июл 2024, 20:10

Вернуться в «Python»