Красивый суп возвращает нет, когда я иду на любые другие страницы, отличные от 1 на веб -сайте

Красивый суп возвращает нет, когда я иду на любые другие страницы, отличные от 1 на веб -сайте ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Красивый суп возвращает нет, когда я иду на любые другие страницы, отличные от 1 на веб -сайте

Цитата

Сообщение Anonymous » 15 июн 2025, 08:53

Я делаю проект Python, в котором пользователь может искать стажировку, которую они хотят, и программа будет отображать данные о данных всех стажировок с веб -сайта Internshala, но у меня возникает проблема, которую красивый суп только читает страницу 1, и после этого он не возвращает ни одного. < /p>
import pandas as pd
from bs4 import BeautifulSoup
import requests
import time
a=input("enter the internship position:")
def get_soup(a, pageno="1"):
url = "https://internshala.com/internships/keywords-"
l = a.split()
for n, i in enumerate(l):
if n != len(l) - 1:
url += i + "%20"
else:
url += i + "/"
url += f"page-{pageno}/"

head = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36"
}

req = requests.get(url, headers=head)
soup = BeautifulSoup(req.content, "html.parser")
return soup

def get_pageno():
num=get_soup(a).find("div",class_="page_number heading_6").find_all("a")[-1].text.strip()
return num

def get_info(no):
info={"company":[],"role":[],"location":[],"stipend":[],"duration":[]}
hlo=get_soup(a,pageno=no).find(id="internship_list_container_1")
internships=hlo.find_all(class_="container-fluid individual_internship view_detail_button visibilityTrackerItem")
for i in internships:
company=i.find("p",class_="company-name").text.strip()
role=i.find("a",class_="job-title-href").text.strip()
location=i.find("div",class_="row-1-item locations").find("a").text.strip()
stipend=i.find("span",class_="stipend").text.strip()
duration=i.find_all("div",class_="row-1-item")[2].find("span").text.strip()
info["company"].append(company)
info["role"].append(role)
info["location"].append(location)
info["stipend"].append(stipend)
info["duration"].append(duration)

df=pd.DataFrame(info)
return df
print(get_soup(a))
info={"company":[],"role":[],"location":[],"stipend":[],"duration":[]}
dfm=pd.DataFrame(info)
for i in range(1,int(get_pageno())+1):
dfm=pd.concat([dfm,get_info(i)])
time.sleep(1)
print(dfm)

Подробнее здесь: https://stackoverflow.com/questions/796 ... 1-in-a-web

1749966805

Anonymous

 Я делаю проект Python, в котором пользователь может искать стажировку, которую они хотят, и программа будет отображать данные о данных всех стажировок с веб -сайта Internshala, но у меня возникает проблема, которую красивый суп только читает страницу 1, и после этого он не возвращает ни одного. < /p>
import pandas as pd
from bs4 import BeautifulSoup
import requests
import time
a=input("enter the internship position:")
def get_soup(a, pageno="1"):
url = "https://internshala.com/internships/keywords-"
l = a.split()
for n, i in enumerate(l):
if n != len(l) - 1:
url += i + "%20"
else:
url += i + "/"
url += f"page-{pageno}/"

head = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36"
}

req = requests.get(url, headers=head)
soup = BeautifulSoup(req.content, "html.parser")
return soup

def get_pageno():
num=get_soup(a).find("div",class_="page_number heading_6").find_all("a")[-1].text.strip()
return num

def get_info(no):
info={"company":[],"role":[],"location":[],"stipend":[],"duration":[]}
hlo=get_soup(a,pageno=no).find(id="internship_list_container_1")
internships=hlo.find_all(class_="container-fluid individual_internship view_detail_button visibilityTrackerItem")
for i in internships:
company=i.find("p",class_="company-name").text.strip()
role=i.find("a",class_="job-title-href").text.strip()
location=i.find("div",class_="row-1-item locations").find("a").text.strip()
stipend=i.find("span",class_="stipend").text.strip()
duration=i.find_all("div",class_="row-1-item")[2].find("span").text.strip()
info["company"].append(company)
info["role"].append(role)
info["location"].append(location)
info["stipend"].append(stipend)
info["duration"].append(duration)

df=pd.DataFrame(info)
return df
print(get_soup(a))
info={"company":[],"role":[],"location":[],"stipend":[],"duration":[]}
dfm=pd.DataFrame(info)
for i in range(1,int(get_pageno())+1):
dfm=pd.concat([dfm,get_info(i)])
time.sleep(1)
print(dfm)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79665604/beautiful-soup-returns-a-none-when-i-go-to-any-other-pages-other-than-1-in-a-web[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Красивый суп возвращает нет, когда я иду на любые другие страницы, отличные от 1 на веб -сайте

Последнее сообщение Anonymous « 14 июн 2025, 09:42
Добавлено в форуме Python

Anonymous » 14 июн 2025, 09:42 » в форуме Python

Итак, я делаю проект Python, в котором пользователь может искать стажировку, которую они хотят, и программа будет отображать данные о данных всех стажировок с веб -сайта Internshala, но у меня возникает проблема, которую красивый суп только читает...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
14 июн 2025, 09:42
Красивый суп возвращает нет, когда я иду на любые другие страницы, отличные от 1 на веб -сайте

Последнее сообщение Anonymous « 14 июн 2025, 12:22
Добавлено в форуме Python

Anonymous » 14 июн 2025, 12:22 » в форуме Python

Итак, я делаю проект Python, в котором пользователь может искать стажировку, которую они хотят, и программа будет отображать данные о данных всех стажировок с веб -сайта Internshala, но у меня возникает проблема, которую красивый суп только читает...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
14 июн 2025, 12:22
Красивый суп возвращает нет, когда я иду на любые другие страницы, отличные от 1 на веб -сайте

Последнее сообщение Anonymous « 14 июн 2025, 21:05
Добавлено в форуме Python

Anonymous » 14 июн 2025, 21:05 » в форуме Python

Я делаю проект Python, в котором пользователь может искать стажировку, которую они хотят, и программа будет отображать данные о данных всех стажировок с веб -сайта Internshala, но у меня возникает проблема, которую красивый суп только читает...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
14 июн 2025, 21:05
Красивый суп не находит внутренний промежуток внутри внешнего промежутка

Последнее сообщение Гость « 14 мар 2024, 09:33
Добавлено в форуме Python

Гость » 14 мар 2024, 09:33 » в форуме Python

Я пытаюсь создать трекер цен для курсов Udemy просто как личный проект, поскольку я довольно часто проверяю сайт на предмет продаж курсов, которые хотел бы купить. Я пытаюсь использовать Beautiful Soup, чтобы получить цену из HTML-скрипта. Каждый...

0 Ответы

85 Просмотры

Последнее сообщение Гость
14 мар 2024, 09:33
Красивый суп найти все, не найти div ПОСЛЕ нажатия кнопки

Последнее сообщение Anonymous « 09 май 2024, 19:12
Добавлено в форуме Python

Anonymous » 09 май 2024, 19:12 » в форуме Python

Я пытаюсь удалить этот веб-сайт.
Проблема возникает, когда я пытаюсь удалить данные, относящиеся к сетке автомобильного оборудования. Я могу извлечь только те элементы, которые уже показаны на странице, даже если я нажму кнопку, чтобы показать их...

0 Ответы

58 Просмотры

Последнее сообщение Anonymous
09 май 2024, 19:12

Вернуться в «Python»