Я не могу получить доступ ни к чему на этой веб-странице, Scrapy каждый раз выдаёт пустое или нулевое значение

Я не могу получить доступ ни к чему на этой веб-странице, Scrapy каждый раз выдаёт пустое или нулевое значение ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Я не могу получить доступ ни к чему на этой веб-странице, Scrapy каждый раз выдаёт пустое или нулевое значение

Цитата

Сообщение Anonymous » 13 июл 2024, 23:54

Веб-страница: https://opensupplyhub.org/facilities?fa ... utors_desc
Сейчас я пробую скрап-драматургию. Я также пробовал использовать селен, но безрезультатно.
Я могу получить доступ к телу и корневому элементу div. Я понимаю, что страница динамически загружается с использованием Java, но я не могу ничего загрузить после корневого div. Я получаю ноль каждый раз, когда пытаюсь получить доступ к элементу div с бесконечной прокруткой. (или любой другой div, если уж на то пошло). Сейчас это мой код:

Код: Выделить всё

import scrapy
from OpenSupply.items import FacItem
from scrapy_playwright.page import PageMethod

class FacspiderSpider(scrapy.Spider):
name = "facspider"

def start_requests(self):
url = "https://opensupplyhub.org/facilities?facility_type=Final%20Product%20Assembly&sort_by=contributors_desc"

yield scrapy.Request(url, meta=dict(
playwright = True,
playwright_include_page = True,
playwright_page_methods = [
PageMethod('wait_for_selector', 'div.infinite-scroll'),
],
errback = self.errback
))

def parse(self, response):
facitem = FacItem()
for comp in response.css('div.infinite-scroll div'):
facitem['test'] = comp.css('span').get()
yield facitem

async def errback(self, failure):
page = failure.request.meta["playwright_page"]
await page.close()

Я пробовал использовать Scrapy-Splash, но не смог получить никакого результата. Я также пробовал использовать разные заголовки.

Подробнее здесь: https://stackoverflow.com/questions/787 ... null-every

1720904077

Anonymous

Веб-страница: https://opensupplyhub.org/facilities?facility_type=Final%20Product%20Assembly&sort_by=contributors_desc
Сейчас я пробую скрап-драматургию. Я также пробовал использовать селен, но безрезультатно.
Я могу получить доступ к телу и корневому элементу div. Я понимаю, что страница динамически загружается с использованием Java, но я не могу ничего загрузить после корневого div. Я получаю ноль каждый раз, когда пытаюсь получить доступ к элементу div с бесконечной прокруткой. (или любой другой div, если уж на то пошло). Сейчас это мой код:
[code]import scrapy
from OpenSupply.items import FacItem
from scrapy_playwright.page import PageMethod

class FacspiderSpider(scrapy.Spider):
name = "facspider"

def start_requests(self):
url = "https://opensupplyhub.org/facilities?facility_type=Final%20Product%20Assembly&sort_by=contributors_desc"

yield scrapy.Request(url, meta=dict(
playwright = True,
playwright_include_page = True,
playwright_page_methods = [
PageMethod('wait_for_selector', 'div.infinite-scroll'),
],
errback = self.errback
))

def parse(self, response):
facitem = FacItem()
for comp in response.css('div.infinite-scroll div'):
facitem['test'] = comp.css('span').get()
yield facitem

async def errback(self, failure):
page = failure.request.meta["playwright_page"]
await page.close()
[/code]
Я пробовал использовать Scrapy-Splash, но не смог получить никакого результата. Я также пробовал использовать разные заголовки. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78744905/im-unable-to-access-anything-in-this-webpage-scrapy-yields-empty-or-null-every[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

LiveData получает пустое или нулевое значение в одном случае и правильное значение в другом случае. Не могу понять причи

Последнее сообщение Anonymous « 06 окт 2024, 08:35
Добавлено в форуме Android

Anonymous » 06 окт 2024, 08:35 » в форуме Android

Я пытаюсь получить поле «имя» из базы данных Firestore с помощью двух разных процессов. В обоих процессах я использую вспомогательный класс для получения данных как Flow >, а затем в ViewModel собираю их и покрываю как LiveData. Но в одном случае я...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
06 окт 2024, 08:35
Более простой способ написать нулевое или пустое значение на С#?

Последнее сообщение Гость « 19 мар 2024, 12:51
Добавлено в форуме C#

Гость » 19 мар 2024, 12:51 » в форуме C#

Я уверен, что что-то пропустил. В определенном проекте мне нужно проверить, является ли строка нулевой или пустой.
Есть ли более простой способ написать это?
if (myString == null || myString == )
{
...

Подробнее здесь:

0 Ответы

11 Просмотры

Последнее сообщение Гость
19 мар 2024, 12:51
Раскрывающийся список, в котором можно выбрать пустое или нулевое значение.

Последнее сообщение Anonymous « 29 июн 2024, 05:27
Добавлено в форуме C#

Anonymous » 29 июн 2024, 05:27 » в форуме C#

Мой раскрывающийся список привязан к базе данных, я хочу, чтобы он позволял выбирать значения NULL. Поэтому, когда он выбран, в таблицу ничего не попадает. Прямо сейчас это работает, если бы я установил целое число, но я не хочу, чтобы это работало...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
29 июн 2024, 05:27
Обработка байтовых строк в среде робота возвращает нулевое или пустое значение.

Последнее сообщение Anonymous « 07 окт 2024, 15:15
Добавлено в форуме Python

Anonymous » 07 окт 2024, 15:15 » в форуме Python

У меня есть результаты, возвращаемые функцией, и я сохраняю их в словаре следующим образом
${results}={'value': b'\x01\x00\x01\x00\x01\x00', 'type': None, 'error': None}
Теперь я хочу извлечь только значение ключа «value» в другую переменную....

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
07 окт 2024, 15:15
Обработка байтовых строк в среде робота возвращает нулевое или пустое значение.

Последнее сообщение Anonymous « 07 окт 2024, 15:41
Добавлено в форуме Python

Anonymous » 07 окт 2024, 15:41 » в форуме Python

У меня есть результаты, возвращаемые функцией, и я сохраняю их в словаре следующим образом
${results}={'value': b'\x01\x00\x01\x00\x01\x00', 'type': None, 'error': None}
Теперь я хочу извлечь только значение ключа «value» в другую переменную....

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
07 окт 2024, 15:41

Вернуться в «Python»