Я выполняю проект по очистке веб-страниц, в котором мне нужно получить различные данные, сканируя веб-сайт Just Watch с помощью прекрасного супа и запроса, но у меня возникли проблемы с очисткой всех URL-адресов телешоу по ссылке: 'https ://www.justwatch.com/in/tv-showsrelease_year_from=2000'.
Я пытался очистить все URL-адреса и получал их, но получал все URL-адреса, которые имели «/tv-show», даже такие URL-адреса, как «https://www.justwatch.com/in/tv-shows?r ... _from=2000» и т. д.
def fetch_tv_urls(url):
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
}
response = requests.get(url, headers=headers)
if response.status_code != 200:
return "Failed to retrieve the page, status code:", response.status_code
soup = BeautifulSoup(response.text, 'html.parser')
return soup
Подробнее здесь: https://stackoverflow.com/questions/793 ... l-tv-shows
Парсинг веб-страниц с помощью BeautifulSoup и запрос на поиск URL-адресов всех телешоу [дубликат] ⇐ Python
Программы на Python
1736543263
Anonymous
Я выполняю проект по очистке веб-страниц, в котором мне нужно получить различные данные, сканируя веб-сайт Just Watch с помощью прекрасного супа и запроса, но у меня возникли проблемы с очисткой всех URL-адресов телешоу по ссылке: 'https ://www.justwatch.com/in/tv-showsrelease_year_from=2000'.
Я пытался очистить все URL-адреса и получал их, но получал все URL-адреса, которые имели «/tv-show», даже такие URL-адреса, как «https://www.justwatch.com/in/tv-shows?release_year_from=2000» и т. д.
def fetch_tv_urls(url):
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
}
response = requests.get(url, headers=headers)
if response.status_code != 200:
return "Failed to retrieve the page, status code:", response.status_code
soup = BeautifulSoup(response.text, 'html.parser')
return soup
Подробнее здесь: [url]https://stackoverflow.com/questions/79347022/web-scraping-using-beautifulsoup-and-request-to-find-url-of-all-tv-shows[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия