Как проанализировать веб-сайт с нумерацией страниц с помощью Aiohttp в Python? И я не знаю, сколько на самом деле страниPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как проанализировать веб-сайт с нумерацией страниц с помощью Aiohttp в Python? И я не знаю, сколько на самом деле страни

Сообщение Anonymous »

Я знаю, как это сделать, используя библиотеку Requests с хитрым циклом True, и когда я получаю пустую страницу или ошибку 404, я ломаю ее. Но, используя aiohttp, я использую сбор и просто останавливаю() все задачи, когда страница пуста, и я теряю незавершенные задачи.

Код: Выделить всё

async def get_goods_from_pages(session, page):
url = f'https://somewebsite?page={page}'
async with session.get(url, headers=headers) as r:
soup = BS(await r.text(), 'lxml')

all_goods = soup.find_all('div', class_='js_category-list-item')
print(r.read())
if all_goods:
for el in all_goods:
print(el)
else:
raise SomeError

# collect all tasks function
async def get_pages_info():
tasks = []
async with aiohttp.ClientSession() as session:
for page in range(1, 150):
task = asyncio.create_task(get_goods_from_pages(session, page))
tasks.append(task)
try:
group = asyncio.gather(*tasks)
await group
except Exception:
group.cancel()
Я также пытался использовать цикл while True и вызывать функцию с помощью await, но у меня была очень плохая скорость анализа

Подробнее здесь: https://stackoverflow.com/questions/782 ... i-dont-kno
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Aiohttp: как получить данные (тело) на сервере aiohttp из Requests.get
    Anonymous » » в форуме Python
    0 Ответы
    72 Просмотры
    Последнее сообщение Anonymous
  • Веб-скрапинг динамических таблиц с нумерацией страниц
    Anonymous » » в форуме Python
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous
  • Веб-скрапинг динамических таблиц с нумерацией страниц
    Anonymous » » в форуме Python
    0 Ответы
    13 Просмотры
    Последнее сообщение Anonymous
  • Как решить проблему с нумерацией страниц плагина bbpress с помощью paginate_link()
    Anonymous » » в форуме Php
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous
  • Оглавление Python ReportLab Проблема с нумерацией страниц
    Anonymous » » в форуме Python
    1 Ответы
    40 Просмотры
    Последнее сообщение 111

Вернуться в «Python»