ConnectionError(err, request=request) Requests.Exceptions.ConnectionError: ('Соединение прервано.', RemoteDisconnected('

ConnectionError(err, request=request) Requests.Exceptions.ConnectionError: ('Соединение прервано.', RemoteDisconnected(' ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

ConnectionError(err, request=request) Requests.Exceptions.ConnectionError: ('Соединение прервано.', RemoteDisconnected('

Цитата

Сообщение Anonymous » 05 янв 2025, 04:01

ConnectionError(err, request=request) Requests.Exceptions.ConnectionError: («Соединение прервано.», RemoteDisconnected («Удаленное завершение закрытого соединения без ответа»))

Мой код выдает эту ошибку после длительного удаления (cloudscraper в моем коде очень медленный). На сайте можно разобрать 5000 автомобилей, а максимальный охват — 1000 данных.
Я новичок в парсере.
Код:

Код: Выделить всё

import scrapy
import re
import cloudscraper
import pandas as pd

class CarsSpider(scrapy.Spider):
name = "cars"
start_urls = ["https://www.olx.com.br/autos-e-pecas/carros-vans-e-utilitarios"]
custom_settings = {
'DOWNLOAD_DELAY': 0,
'RANDOMIZE_DOWNLOAD_DELAY': False,
'CONCURRENT_REQUESTS': 256,
'CONCURRENT_REQUESTS_PER_DOMAIN': 32,
'AUTOTHROTTLE_ENABLED': True,
'AUTOTHROTTLE_START_DELAY': 1,
'AUTOTHROTTLE_MAX_DELAY': 10,
'AUTOTHROTTLE_TARGET_CONCURRENCY': 2.0,
'AUTOTHROTTLE_DEBUG': True,
}

def __init__(self, *args, **kwargs):
super().__init__(*args, **kwargs)
self.scraper = cloudscraper.create_scraper(browser={'browser': 'firefox', 'platform': 'windows', 'desktop': True})
self.carros_data = []

def start_requests(self):
for url in self.start_urls:
self.logger.info(f"Usando cloudscraper para acessar: {url}")
response = self.scraper.get(url)
if response.status_code == 200:
scrapy_response = scrapy.http.TextResponse(
url=response.url,
body=response.text,
encoding="utf-8"
)
yield from self.parse(scrapy_response, 1)  # Começa na página 1
else:
self.logger.error(f"Erro ao acessar {url}: {response.status_code}")

def parse(self, response, current_page):
link_carros = response.xpath('/html/body/div[1]/div/main/div[2]/div/main/div[7]/section/div/div/div/a/@href').extract()
preco_carros = response.xpath('/html/body/div[1]/div/main/div[2]/div/main/div[7]/section/div[2]/div[1]/div[2]/h3/text()').extract()

for link, preco in zip(link_carros, preco_carros):
self.logger.info(f"Usando cloudscraper para acessar detalhes: {link}")
response = self.scraper.get(link)
if response.status_code == 200:
scrapy_response = scrapy.http.TextResponse(
url=response.url,
body=response.text,
encoding="utf-8"
)
yield from self.parse_detail(scrapy_response, response.url)
else:
self.logger.error(f"Erro ao acessar {link}: {response.status_code}")

# Navega para a próxima página até o limite de 100
next_page = current_page + 1
if next_page 

Подробнее здесь: [url]https://stackoverflow.com/questions/79329881/connectionerrorerr-request-request-requests-exceptions-connectionerror-con[/url]

1736038870

Anonymous


ConnectionError(err, request=request) Requests.Exceptions.ConnectionError: («Соединение прервано.», RemoteDisconnected («Удаленное завершение закрытого соединения без ответа»))

Мой код выдает эту ошибку после длительного удаления (cloudscraper в моем коде очень медленный).  На сайте можно разобрать 5000 автомобилей, а максимальный охват — 1000 данных.
Я новичок в парсере.
Код:
[code]
import scrapy
import re
import cloudscraper
import pandas as pd

class CarsSpider(scrapy.Spider):
name = "cars"
start_urls = ["https://www.olx.com.br/autos-e-pecas/carros-vans-e-utilitarios"]
custom_settings = {
'DOWNLOAD_DELAY': 0,
'RANDOMIZE_DOWNLOAD_DELAY': False,
'CONCURRENT_REQUESTS': 256,
'CONCURRENT_REQUESTS_PER_DOMAIN': 32,
'AUTOTHROTTLE_ENABLED': True,
'AUTOTHROTTLE_START_DELAY': 1,
'AUTOTHROTTLE_MAX_DELAY': 10,
'AUTOTHROTTLE_TARGET_CONCURRENCY': 2.0,
'AUTOTHROTTLE_DEBUG': True,
}

def __init__(self, *args, **kwargs):
super().__init__(*args, **kwargs)
self.scraper = cloudscraper.create_scraper(browser={'browser': 'firefox', 'platform': 'windows', 'desktop': True})
self.carros_data = []

def start_requests(self):
for url in self.start_urls:
self.logger.info(f"Usando cloudscraper para acessar: {url}")
response = self.scraper.get(url)
if response.status_code == 200:
scrapy_response = scrapy.http.TextResponse(
url=response.url,
body=response.text,
encoding="utf-8"
)
yield from self.parse(scrapy_response, 1)  # Começa na página 1
else:
self.logger.error(f"Erro ao acessar {url}: {response.status_code}")

def parse(self, response, current_page):
link_carros = response.xpath('/html/body/div[1]/div/main/div[2]/div/main/div[7]/section/div/div/div/a/@href').extract()
preco_carros = response.xpath('/html/body/div[1]/div/main/div[2]/div/main/div[7]/section/div[2]/div[1]/div[2]/h3/text()').extract()

for link, preco in zip(link_carros, preco_carros):
self.logger.info(f"Usando cloudscraper para acessar detalhes: {link}")
response = self.scraper.get(link)
if response.status_code == 200:
scrapy_response = scrapy.http.TextResponse(
url=response.url,
body=response.text,
encoding="utf-8"
)
yield from self.parse_detail(scrapy_response, response.url)
else:
self.logger.error(f"Erro ao acessar {link}: {response.status_code}")

# Navega para a próxima página até o limite de 100
next_page = current_page + 1
if next_page 

Подробнее здесь: [url]https://stackoverflow.com/questions/79329881/connectionerrorerr-request-request-requests-exceptions-connectionerror-con[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

TeleBot: «Исключение бесконечного опроса: («Соединение прервано.», RemoteDisconnected («Удаленное соединение закрыто без

Последнее сообщение Гость « 01 ноя 2023, 15:42
Добавлено в форуме Python

Гость » 01 ноя 2023, 15:42 » в форуме Python

Я использую Telebot (pyTelegramBotAPI) для запуска своего бота Telegram. Я запускаю его на AWS в ECS в контейнере Docker. К сожалению, случайно возникает ошибка: TeleBot: «Исключение бесконечного опроса: («Соединение прервано.», RemoteDisconnected...

0 Ответы

146 Просмотры

Последнее сообщение Гость
01 ноя 2023, 15:42
'Соединение прервано.', RemoteDisconnected('Удаленное соединение закрыто без ответа',)

Последнее сообщение Anonymous « 17 сен 2024, 08:00
Добавлено в форуме Python

Anonymous » 17 сен 2024, 08:00 » в форуме Python

Я использую стороннюю службу API для отправки текста.
Когда я отправляю около 5000 номеров в качестве полезной нагрузки в API, все работает нормально. Я заметил это иногда, когда количество полезной нагрузки превышает 7000 или выше. В ответ от API я...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 08:00
'Соединение прервано.', RemoteDisconnected('Удаленное соединение закрыто без ответа',)

Последнее сообщение Anonymous « 15 янв 2025, 09:02
Добавлено в форуме Python

Anonymous » 15 янв 2025, 09:02 » в форуме Python

Я использую стороннюю службу API для отправки текста.
Когда я отправляю около 5000 номеров в качестве полезной нагрузки в API, все работает нормально. Я заметил это иногда, когда количество полезной нагрузки превышает 7000 или выше. В ответ от API я...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
15 янв 2025, 09:02
Соединение прервано, удаленное соединение отключено (удаленное завершение закрытого соединения без ответа) в python Sess

Последнее сообщение Anonymous « 18 сен 2024, 14:09
Добавлено в форуме Python

Anonymous » 18 сен 2024, 14:09 » в форуме Python

У меня возникли проблемы с использованием метода request() класса Session в Python.
В моем бэкэнде, если я вызываю API с помощью метода request() в первый раз, когда появляется ответ. Но если я вызову этот метод через 5 минут, он выдаст

Соединение...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
18 сен 2024, 14:09
Запрос Исключение: («Соединение прервано»., Demotedisconconed ('Удаленный концом закрытый соединение без ответа')))

Последнее сообщение Anonymous « 17 май 2025, 13:58
Добавлено в форуме Python

Anonymous » 17 май 2025, 13:58 » в форуме Python

Я делаю приложение Python для извлечения данных с моего веб-сайта (который написан в PHP) как поток. import requests
from sseclient import SSEClient

def get_sse(url):
try:
# Make the request to the SSE endpoint
response = requests.get(url,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
17 май 2025, 13:58

Вернуться в «Python»