Может ли кто-нибудь помочь мне определить, «продан» ли щенок, на основании сообщения «Этот щенок больше не доступен» в с

Может ли кто-нибудь помочь мне определить, «продан» ли щенок, на основании сообщения «Этот щенок больше не доступен» в с ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Может ли кто-нибудь помочь мне определить, «продан» ли щенок, на основании сообщения «Этот щенок больше не доступен» в с

Цитата

Сообщение Anonymous » 05 июл 2024, 04:44

Я пытаюсь создать набор данных для извлечения информации с pawrade.com обо всех перечисленных «французских бульдогах».
Я запустил скрипт очистки, но не могу похоже, столбец «Статус» работает правильно. Если вы попали в списки проданных щенков, то увидите надпись «Этого щенка больше нет в наличии». сообщение. Я использую это сообщение, чтобы определить, продан ли щенок в столбце «Статус».
import requests
from bs4 import BeautifulSoup
import csv

# Function to scrape a single page
def scrape_page(url, csv_writer):
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
spans = soup.find_all("span", class_="fave position-absolute")

for span in spans:
adid = span.get("data-adid")
name = span.get("data-name")
breed = span.get("data-breed")
price = span.get("data-price")
puppy_url = f"https://www.pawrade.com/puppies/french-bulldog/{adid}"

# Extract additional details from the puppy's individual page
puppy_response = requests.get(puppy_url)
puppy_soup = BeautifulSoup(puppy_response.content, "html.parser")

dob = extract_detail(puppy_soup, "fa-birthday-cake")
weight = extract_detail(puppy_soup, "fa-weight")
registration = extract_detail(puppy_soup, "fa-trophy")
color = extract_detail(puppy_soup, "fa-palette")
release_date = extract_detail(puppy_soup, "fa-calendar-alt")
microchip = extract_detail(puppy_soup, "fa-microchip")

# Determine status based on the presence of specific messages
status = "available"
if puppy_soup.find("h4", class_="mb-0") and "This puppy is no longer available." in puppy_soup.find("h4", class_="mb-0").text:
status = "sold"

csv_writer.writerow([adid, name, breed, price, puppy_url, dob, weight, registration, color, release_date, microchip, status])

# Helper function to extract details based on class
def extract_detail(soup, class_name):
detail_element = soup.find("span", class_=class_name)
if detail_element:
detail_text = detail_element.find_next_sibling("div").find("small").text.strip()
return detail_text
return ""

# URL of the first page of listings
base_url = "https://www.pawrade.com/puppies/french-bulldog/"

# Create a CSV file
with open("french_bulldogs.csv", mode="w", newline="", encoding="utf-8") as csv_file:
csv_writer = csv.writer(csv_file)
csv_writer.writerow(["AdID", "Name", "Breed", "Price", "URL", "DOB", "Weight", "Registration", "Color", "Release Date", "Microchip", "Status"])

# Scrape the first page to get the total number of pages
response = requests.get(base_url)
soup = BeautifulSoup(response.content, "html.parser")

# Example logic to determine total pages - this may need adjustment based on actual site structure
pagination = soup.find("ul", class_="pagination")
if pagination:
pages = pagination.find_all("li", class_="page-item")
total_pages = int(pages[-2].text.strip()) # Adjust the logic to find the total number of pages
else:
total_pages = 1 # Default to 1 if no pagination found

# Iterate through all pages
for page in range(1, total_pages + 1):
url = f"{base_url}?page={page}"
scrape_page(url, csv_writer)

print("Data has been written to french_bulldogs.csv")

Подробнее здесь: https://stackoverflow.com/questions/787 ... the-this-p

1720143874

Anonymous

Я пытаюсь создать набор данных для извлечения информации с pawrade.com обо всех перечисленных «французских бульдогах».
Я запустил скрипт очистки, но не могу похоже, столбец «Статус» работает правильно.  Если вы попали в списки проданных щенков, то увидите надпись «Этого щенка больше нет в наличии». сообщение. Я использую это сообщение, чтобы определить, продан ли щенок в столбце «Статус».
import requests
from bs4 import BeautifulSoup
import csv

# Function to scrape a single page
def scrape_page(url, csv_writer):
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
spans = soup.find_all("span", class_="fave position-absolute")

for span in spans:
adid = span.get("data-adid")
name = span.get("data-name")
breed = span.get("data-breed")
price = span.get("data-price")
puppy_url = f"https://www.pawrade.com/puppies/french-bulldog/{adid}"

# Extract additional details from the puppy's individual page
puppy_response = requests.get(puppy_url)
puppy_soup = BeautifulSoup(puppy_response.content, "html.parser")

dob = extract_detail(puppy_soup, "fa-birthday-cake")
weight = extract_detail(puppy_soup, "fa-weight")
registration = extract_detail(puppy_soup, "fa-trophy")
color = extract_detail(puppy_soup, "fa-palette")
release_date = extract_detail(puppy_soup, "fa-calendar-alt")
microchip = extract_detail(puppy_soup, "fa-microchip")

# Determine status based on the presence of specific messages
status = "available"
if puppy_soup.find("h4", class_="mb-0") and "This puppy is no longer available." in puppy_soup.find("h4", class_="mb-0").text:
status = "sold"

csv_writer.writerow([adid, name, breed, price, puppy_url, dob, weight, registration, color, release_date, microchip, status])

# Helper function to extract details based on class
def extract_detail(soup, class_name):
detail_element = soup.find("span", class_=class_name)
if detail_element:
detail_text = detail_element.find_next_sibling("div").find("small").text.strip()
return detail_text
return ""

# URL of the first page of listings
base_url = "https://www.pawrade.com/puppies/french-bulldog/"

# Create a CSV file
with open("french_bulldogs.csv", mode="w", newline="", encoding="utf-8") as csv_file:
csv_writer = csv.writer(csv_file)
csv_writer.writerow(["AdID", "Name", "Breed", "Price", "URL", "DOB", "Weight", "Registration", "Color", "Release Date", "Microchip", "Status"])

# Scrape the first page to get the total number of pages
response = requests.get(base_url)
soup = BeautifulSoup(response.content, "html.parser")

# Example logic to determine total pages - this may need adjustment based on actual site structure
pagination = soup.find("ul", class_="pagination")
if pagination:
pages = pagination.find_all("li", class_="page-item")
total_pages = int(pages[-2].text.strip())  # Adjust the logic to find the total number of pages
else:
total_pages = 1  # Default to 1 if no pagination found

# Iterate through all pages
for page in range(1, total_pages + 1):
url = f"{base_url}?page={page}"
scrape_page(url, csv_writer)

print("Data has been written to french_bulldogs.csv")
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78709384/can-anyone-help-me-extract-whether-or-not-a-puppy-is-sold-based-on-the-this-p[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Есть ли кто-нибудь, кто может помочь мне или помочь мне в создании проектов развития [закрыто]

Последнее сообщение Anonymous « 16 ноя 2024, 22:01
Добавлено в форуме C++

Anonymous » 16 ноя 2024, 22:01 » в форуме C++

Я учусь на пятом семестре. Я изучал основы программирования, ООП, структуры данных и алгоритмы, операционную систему, базу данных (SQL). Я создал несколько проектов, но хочу получить отраслевой опыт, например работу над проектами, и по этой причине...

0 Ответы

99 Просмотры

Последнее сообщение Anonymous
16 ноя 2024, 22:01
Почему твоя мать родила такого ребенка, как ты, внебрачного ребенка и почему твой отец был продан твоей матери [закрыто]

Последнее сообщение Anonymous « 05 мар 2024, 03:51
Добавлено в форуме Php

Anonymous » 05 мар 2024, 03:51 » в форуме Php

1.anak haram dari bapak mu yang membuat ibumu pepeknya hancur berantakan

2.
**
[``` your text*
>! *Column A | Column B | | --- | --- | | Cell 1 | Cell 2 | | Cell 3 | Cell 4 | your text pepek ibumu bau

Источник:

0 Ответы

64 Просмотры

Последнее сообщение Anonymous
05 мар 2024, 03:51
Почему твоя мать родила такого ребенка, как ты, внебрачного ребенка и почему твой отец был продан твоей матери [закрыто]

Последнее сообщение Anonymous « 05 мар 2024, 03:51
Добавлено в форуме IOS

Anonymous » 05 мар 2024, 03:51 » в форуме IOS

1.anak haram dari bapak mu yang membuat ibumu pepeknya hancur berantakan

2.
**
[``` your text*
>! *Column A | Column B | | --- | --- | | Cell 1 | Cell 2 | | Cell 3 | Cell 4 | your text pepek ibumu bau

Источник:

0 Ответы

62 Просмотры

Последнее сообщение Anonymous
05 мар 2024, 03:51
Android 14, Jetpack Compose — ни один щенок не запрашивает разрешение на определение местоположения и отсутствует в наст

Последнее сообщение Anonymous « 21 июн 2024, 16:41
Добавлено в форуме Android

Anonymous » 21 июн 2024, 16:41 » в форуме Android

В моем приложении Jetpack Compose у меня есть Composable-помощник, который запрашивает разрешения на определение местоположения:
@Composable
fun GpsLocationHelper(hasLocationAccess: (Boolean)->Unit){

val context = LocalContext.current
val...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
21 июн 2024, 16:41
Моя форма PHP не работает, когда она находится на сервере. может кто-нибудь помочь определить проблему?

Последнее сообщение Anonymous « 18 окт 2023, 17:39
Добавлено в форуме Php

Anonymous » 18 окт 2023, 17:39 » в форуме Php

Вот код моего HTML и PHP.

Когда я нажимаю «Отправить» в форме, я попадаю на правильную страницу header( location: contact-us.html?mailsent );, однако я ничего не получаю по электронной почте. адрес прилагается. Может ли кто-нибудь помочь мне...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
18 окт 2023, 17:39

Вернуться в «Python»