Получение пустого вывода при использовании Scrapy DrumwrightPython

Программы на Python
Ответить
Anonymous
 Получение пустого вывода при использовании Scrapy Drumwright

Сообщение Anonymous »

Я пытался использовать Scrapy Drumwright, чтобы извлечь немного содержимого с этого веб-сайта: https://www.scrapethissite.com/pages/ajax-javascript/.
Я добавил HTML-код который я пытался очистить:
html-код
Я прикрепил свой код ниже:

Код: Выделить всё

import scrapy
from scrapy_playwright.page import PageMethod

class OscarSpider(scrapy.Spider):
name = "OscarSpider"

def start_requests(self):
yield scrapy.Request(
url="https://www.scrapethissite.com/pages/ajax-javascript/",
callback=self.parse,
meta={
"playwright": True,
"playwright_include_page": True,
"playwright_page_methods": [
PageMethod("wait_for_selector", "a#2010"),  # Ensure button exists
PageMethod("click", "a#2010"),  # Click the button
PageMethod("wait_for_selector", "tr.film"),  # Wait for data to load
PageMethod("evaluate", "window.scrollTo(0, document.body.scrollHeight)"),
PageMethod("wait_for_timeout", 6000)  # Wait for AJAX data
]
}
)

async def parse(self, response):
for row in response.css("tr.film"):
yield {
"title": row.css("td.film-title::text").get(default="").strip(),
"nominations": row.css("td.film-nominations::text").get(default="").strip(),
"awards": row.css("td.film-awards::text").get(default="").strip(),
}

Но даже после его выполнения он не возвращает вывод, когда я печатаю это:

Код: Выделить всё

scrapy crawl OscarSpider -O Oscar.json
Я ожидаю вывода, как показано ниже (в формате JSON):

Код: Выделить всё

Title                   Nominations Awards
The King's Speech            12      4
Inception                     8      4
Пожалуйста, помогите мне в этом отношении.


Подробнее здесь: https://stackoverflow.com/questions/793 ... playwright
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»