Вопрос относительно новичка Scrapy и Scrapy Crowl

Вопрос относительно новичка Scrapy и Scrapy Crowl ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Вопрос относительно новичка Scrapy и Scrapy Crowl

Цитата

Сообщение Anonymous » 15 июл 2024, 23:08

Недавно я начал пытаться научиться парсить веб-страницы с помощью Scrapy. Недавно я попытался выполнить Scrapycrawl на сайте books.toscrape.com. Согласно терминалу, вызов Scrapycrawl работает нормально, но он не возвращает количество предметов и не показывает никакой информации о книгах. Мне было интересно, нормально ли это, или в моем коде есть ошибка.
Вот мой код для решения проблемы, если это поможет кому-нибудь понять, что я делаю.
import scrapy

class BookspiderSpider(scrapy.Spider):
name = "bookspider"
allowed_domains = ["books.toscrape.com"]
start_urls = ["https://books.toscrape.com"]

def parse(self, response):
books = response.css('article.product_pod')
for book in books:
yield{
'name': book.css('h3 a::text').get(),
'url': book.css('h3 a').attrib['href'],
}

next_page = response.css('li.next a ::attr(href)').get()
if next_page is not None:
if 'catalogue/' in next_page:
next_page_url = 'https://books.toscrape.com/' + next_page
else:
next_page_url = 'https://books.toscrape.com/catalogue/' + next_page
yield response.follow(next_page_url , callback = self.parse)

Подробнее здесь: https://stackoverflow.com/questions/769 ... rapy-crawl

1721074137

Anonymous

Недавно я начал пытаться научиться парсить веб-страницы с помощью Scrapy. Недавно я попытался выполнить Scrapycrawl на сайте books.toscrape.com. Согласно терминалу, вызов Scrapycrawl работает нормально, но он не возвращает количество предметов и не показывает никакой информации о книгах. Мне было интересно, нормально ли это, или в моем коде есть ошибка.
Вот мой код для решения проблемы, если это поможет кому-нибудь понять, что я делаю.
import scrapy

class BookspiderSpider(scrapy.Spider):
name = "bookspider"
allowed_domains = ["books.toscrape.com"]
start_urls = ["https://books.toscrape.com"]

def parse(self, response):
books = response.css('article.product_pod')
for book in books:
yield{
'name': book.css('h3 a::text').get(),
'url': book.css('h3 a').attrib['href'],
}

next_page = response.css('li.next a ::attr(href)').get()
if next_page is not None:
if 'catalogue/' in next_page:
next_page_url = 'https://books.toscrape.com/' + next_page
else:
next_page_url = 'https://books.toscrape.com/catalogue/' + next_page
yield response.follow(next_page_url , callback = self.parse)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/76941847/question-regarding-beginner-scrapy-and-scrapy-crawl[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

PHP Foreach Loop с использованием модели MVC для новичка для новичка

Последнее сообщение Anonymous « 27 янв 2025, 06:47
Добавлено в форуме Php

Anonymous » 27 янв 2025, 06:47 » в форуме Php

Новичок в PHP и структуре модели MVC, поэтому, пожалуйста, будьте осторожны, когда я пытаюсь это понять, поскольку я знаю, что делаю некоторые ошибки, но не могу понять, где. Я безуспешно пытался выполнить поиск и поэкспериментировать с другими...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 06:47
Обработка ошибок Scrapy Spider (scrapy.core.scraper)

Последнее сообщение Anonymous « 09 ноя 2024, 10:58
Добавлено в форуме Python

Anonymous » 09 ноя 2024, 10:58 » в форуме Python

Прочитав несколько часов решений, я так и не смог найти ответ на свою проблему.
Я пытаюсь очистить веб-страницу супермаркета, думаю, ошибка в функции синтаксического анализа. Пожалуйста, если кто-то может мне помочь.
import scrapy
from bs4 import...

0 Ответы

50 Просмотры

Последнее сообщение Anonymous
09 ноя 2024, 10:58
2D-преобразование не работает (вопрос новичка)

Последнее сообщение Anonymous « 25 май 2024, 00:11
Добавлено в форуме CSS

Anonymous » 25 май 2024, 00:11 » в форуме CSS

Я пытаюсь использовать 2D-преобразование в проекте своего веб-сайта, чтобы изображение перемещалось из-за экрана с левой стороны в место на экране. Я перепробовал все, что читал в школах W3 и веб-документах MDN, но ничего не помогло. Изображение...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
25 май 2024, 00:11
Ошибка новичка с JOptionPane

Последнее сообщение Anonymous « 30 июн 2024, 06:04
Добавлено в форуме JAVA

Anonymous » 30 июн 2024, 06:04 » в форуме JAVA

Я следую руководству на YouTube для Java с использованием Eclipse.

В настоящее время я пытаюсь умножить два двойных значения и вывести результат как двойной, используя JOptionPane.showMessageDialog , но выдает ошибку.

Вот мой код:

import...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 06:04
Aws sam: самый простой способ для новичка разобраться с версиями Python

Последнее сообщение Anonymous « 01 июл 2024, 18:50
Добавлено в форуме Python

Anonymous » 01 июл 2024, 18:50 » в форуме Python

Поэтому я использую Python 3.12 в своей повседневной работе, и поэтому это единственная версия, которая у меня есть на моем компьютере (Windows). Мне нужно настроить конвейер обработки данных на AWS, который будет включать в себя управление...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
01 июл 2024, 18:50

Вернуться в «Python»