import requests
from bs4 import BeautifulSoup
l = []
o = {}
#declare the target URL and make an HTTP connection to that website.
target_url = 'https://www.indeed.com/jobs?q=data+analyst&l=New+York%2C+NY&from=searchOnHP&vjk=7cfb06a1924a00ef&advn\
=8756188910781422'
head = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:131.0) Gecko/20100101 Firefox/131.0",
"Accept-Encoding": "gzip, deflate, br",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8",
"Connection": "keep-alive",
"Accept-Language": "en-US,en;q=0.9,lt;q=0.8,et;q=0.7,de;q=0.6",
}
resp = requests.get(target_url, headers=head)
soup = BeautifulSoup(resp.text, 'html.parser')
allData = soup.find("div", {"class": "mosaic-provider-jobcards"})
#iterate over each of these li tags and extract all the data one by one using a for loop.
alllitags = allData.find_all("li", {"class":"eu4oa1w0"})
for i in range(0,len(alllitags)):
try:
o["name-of-the-job"]=alllitags[i].find("a").find("span").text
except:
o["name-of-the-job"] = None
try:
o["name-of-the-company"] = alllitags[i].find("span", {"data-testid":"company-name"}).text
except:
o["name-of-the-company"] = None
try:
o["job-location"] = alllitags[i].find("div", {"data-testid":"text-location"}).text
except:
o["job-location"] = None
try:
o["job-details"] = alllitags[i].find("div", {"class":"jobMetaDataGroup"}).text
except:
o["job-details"] = None
try:
o["pay-range"] = alllitags[i].find("div", {"class":"metadata salary-snippet-container"}).text
except:
o["pay-range"] = None
l.append(o)
o={}
print(l)
Я знаю, что это распространенная ошибка при веб-скрапинге, но мне хотелось бы получить конкретное объяснение.
Следуя этому руководству https://www.scrapingdog.com/blog/scrape-indeed-using-python/, вы столкнулись с этой ошибкой: [code]Traceback (most recent call last): File "C:/Users/det-lab/Documents/PycharmProjects/Indeed_webscrape/Indeed_job_data.py", line 23, in alllitags = allData.find_all("li", {"class":"eu4oa1w0"}) AttributeError: 'NoneType' object has no attribute 'find_all'
[/code] Вот моя версия программы: [code]import requests from bs4 import BeautifulSoup
l = [] o = {}
#declare the target URL and make an HTTP connection to that website.
Я использую BeautifulSoup с Selenium для сбора данных с веб-сайта. Я столкнулся с проблемой, когда доступ к методу get_text() напрямую приводит к ошибке AttributeError, тогда как косвенный доступ к нему не вызывает никаких ошибок.
Вот...
Следуя этому руководству вы столкнулись с этой ошибкой:
Traceback (most recent call last):
File C:/Users/det-lab/Documents/PycharmProjects/Indeed_webscrape/Indeed_job_data.py , line 23, in
alllitags = allData.find_all( li , { class : eu4oa1w0 })...
поэтому я пытаюсь выполнить парсинг с помощью BeautifulSoup и нумерацию страниц с помощью Selenium, так как мне нужно что-то более быстрое, чем Selenium для парсинга. Таким образом, для каждого продукта он получит href этого продукта, объединится с...
я пытаюсь использовать Mediapipe в качестве средства оценки позы с задачейpose_landmarker, используя код документации mediapipe с некоторыми изменениями, однако он продолжает выдавать эту ошибку AttributeError: у объекта 'NoneType' нет атрибута...