Я пытаюсь выполнить парсинг веб-страниц для Myntra, но когда я делаю это с помощью Selenium или Requests, на виртуальной машине это не работает. Может ли кто-нибудь мне помочь с этим?
Я попробовал Selenium и Requests в Python, но не смог получить результаты на виртуальной машине.
Я получил эту ошибку, когда попробовал Scrapy.Spider:
Мой код:
import scrapy
class MySpider(scrapy.Spider):
name = "myntra"
start_urls = ["https://www.myntra.com/handbags/miraggi ... 624596/buy"]
custom_settings = {
'DOWNLOAD_DELAY': 1,
'CONCURRENT_REQUESTS': 1,
'RETRY_TIMES': 3,
'RETRY_HTTP_CODES': [500, 503, 504, 400, 403, 404, 408],
'DOWNLOADER_MIDDLEWARES': {
'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None,
'scrapy.downloadermiddlewares.retry.RetryMiddleware': 90,
'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware': 110,
}
}
def parse(self, response):
price = response.xpath("//span[@class='pdp-price']/text()").extract()
yield {'price': price}
Вот мой журнал ошибок:
24-11-21 22:35:14 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2024-11-21 22:35:14 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying (failed 1 times): User timeout caused connection failure: Getting https://www.myntra.com/handbags/miraggi ... 624596/buy took longer than 180.0 seconds.
2024-11-21 22:35:14 [scrapy_user_agents.middlewares] DEBUG: Assigned User-Agent Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36
Подробнее здесь: https://stackoverflow.com/questions/792 ... al-machine
Парсинг веб-страниц Myntra на виртуальной машине ⇐ Python
Программы на Python
-
Anonymous
1734269125
Anonymous
Я пытаюсь выполнить парсинг веб-страниц для Myntra, но когда я делаю это с помощью Selenium или Requests, на виртуальной машине это не работает. Может ли кто-нибудь мне помочь с этим?
Я попробовал Selenium и Requests в Python, но не смог получить результаты на виртуальной машине.
Я получил эту ошибку, когда попробовал Scrapy.Spider:
Мой код:
import scrapy
class MySpider(scrapy.Spider):
name = "myntra"
start_urls = ["https://www.myntra.com/handbags/miraggio/miraggio-textured-miniature-sling-bag/27624596/buy"]
custom_settings = {
'DOWNLOAD_DELAY': 1,
'CONCURRENT_REQUESTS': 1,
'RETRY_TIMES': 3,
'RETRY_HTTP_CODES': [500, 503, 504, 400, 403, 404, 408],
'DOWNLOADER_MIDDLEWARES': {
'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None,
'scrapy.downloadermiddlewares.retry.RetryMiddleware': 90,
'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware': 110,
}
}
def parse(self, response):
price = response.xpath("//span[@class='pdp-price']/text()").extract()
yield {'price': price}
Вот мой журнал ошибок:
24-11-21 22:35:14 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2024-11-21 22:35:14 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying (failed 1 times): User timeout caused connection failure: Getting https://www.myntra.com/handbags/miraggio/miraggio-textured-miniature-sling-bag/27624596/buy took longer than 180.0 seconds.
2024-11-21 22:35:14 [scrapy_user_agents.middlewares] DEBUG: Assigned User-Agent Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36
Подробнее здесь: [url]https://stackoverflow.com/questions/79282402/myntra-web-scraping-on-a-virtual-machine[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия