Ошибка получения индекса за пределами диапазона при попытке очистить код продукта с веб-сайта (с использованием Python и

Ошибка получения индекса за пределами диапазона при попытке очистить код продукта с веб-сайта (с использованием Python и ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Ошибка получения индекса за пределами диапазона при попытке очистить код продукта с веб-сайта (с использованием Python и

Цитата

Сообщение Anonymous » 04 окт 2024, 01:12

Описание проблемы:

Я пытаюсь автоматизировать процесс, позволяющий посетить веб-сайт и получить информацию о продуктах из топа. 100 товаров на этой странице и поместите их в файл Excel.

Пояснение кода:

У меня есть класс Webscraper, внутри которого я вызываю две функции. Сначала я вызываю функцию scroll_and_click_view_more, которая просто прокручивает веб-страницу, которую я посещаю. Затем я вызываю функцию prod_vitals, которая извлекает код продукта и названия продуктов с этой веб-страницы.

Описание ошибки:

Всякий раз, когда я запускаю код ниже, до определенного максимального значения. продуктов, код зависает после точки и выдает ошибку «Индекс вне диапазона». Если я устанавливаю max_count_of_products=50, код зависает на строке. Если я устанавливаю
max_count_of_products=100, код зависает на 93. Не существует фиксированного индекса, где Я застреваю. Если я изменю значение max_count_of_products, точка, в которой код зависает, также изменится.

Ниже прилагаю скриншоты ошибки.

max_count_of_products=50

Найдите мой код ниже:
products_summary = []
max_count_of_products=100

def scroll_and_click_view_more(driver,href):
flag=False
last_height = driver.execute_script("return window.pageYOffset + window.innerHeight")
while True:
try:
driver.execute_script("window.scrollBy(0, 800);")
time.sleep(4)
new_height = driver.execute_script("return window.pageYOffset + window.innerHeight")
try:
WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, 'div.product-tile')))
except Exception as e:
if new_height == last_height and flag==False:
print("Reached the end of the page and no product tiles were found: ",href)
return "No product tiles found"
else:
last_height = new_height
continue
div_count = 0
flag=True
response = driver.page_source
soup = BeautifulSoup(response, 'html.parser')
div_elements = soup.find_all('div', class_ = 'product-tile')
div_count = len(div_elements)
if(div_count > max_count_of_products):
return(driver.page_source)
else:
driver.execute_script("window.scrollBy(0, 300);")
time.sleep(3)
new_height = driver.execute_script("return window.pageYOffset + window.innerHeight")
#print(new_height)
if new_height == last_height:
return(driver.page_source)
else:
last_height = new_height
except Exception as e:
print(e)
break

def prod_vitals(soup,title,url):
count_of_items=1
products_data = [] # Array to store all product data for our excel sheet
for div in soup.find_all('div', class_ = 'product-tile'): # Iterate over each individual product-tile div tag
if count_of_items

Подробнее здесь: https://stackoverflow.com/questions/790 ... rom-a-webs

1727993561

Anonymous

[b]Описание проблемы:[/b]

Я пытаюсь автоматизировать процесс, позволяющий посетить веб-сайт и получить информацию о продуктах из топа. 100 товаров на этой странице и поместите их в файл Excel.

[b]Пояснение кода:[/b]

У меня есть [b]класс Webscraper[/b], внутри которого я вызываю две функции. Сначала я вызываю функцию [b]scroll_and_click_view_more[/b], которая просто прокручивает веб-страницу, которую я посещаю. Затем я вызываю функцию [b]prod_vitals[/b], которая извлекает код продукта и названия продуктов с этой веб-страницы.

[b]Описание ошибки: [/b]

Всякий раз, когда я запускаю код ниже, до определенного максимального значения. продуктов, код зависает после точки и выдает ошибку «Индекс вне диапазона». Если я устанавливаю [b]max_count_of_products=50[/b], код зависает на строке. Если я устанавливаю
[b]max_count_of_products=100[/b], код зависает на 93. Не существует фиксированного индекса, где Я застреваю.  Если я изменю значение [b]max_count_of_products[/b], точка, в которой код зависает, также изменится.

Ниже прилагаю скриншоты ошибки.

[b]max_count_of_products=50[/b]
[img]https://i.sstatic.net/JfY6hWL2.png[/img]


[b]Найдите мой код ниже:[/b]
products_summary = []
max_count_of_products=100

def scroll_and_click_view_more(driver,href):
flag=False
last_height = driver.execute_script("return window.pageYOffset + window.innerHeight")
while True:
try:
driver.execute_script("window.scrollBy(0, 800);")
time.sleep(4)
new_height = driver.execute_script("return window.pageYOffset + window.innerHeight")
try:
WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, 'div.product-tile')))
except Exception as e:
if new_height == last_height and flag==False:
print("Reached the end of the page and no product tiles were found: ",href)
return "No product tiles found"
else:
last_height = new_height
continue
div_count = 0
flag=True
response = driver.page_source
soup = BeautifulSoup(response, 'html.parser')
div_elements = soup.find_all('div', class_ = 'product-tile')
div_count = len(div_elements)
if(div_count > max_count_of_products):
return(driver.page_source)
else:
driver.execute_script("window.scrollBy(0, 300);")
time.sleep(3)
new_height = driver.execute_script("return window.pageYOffset + window.innerHeight")
#print(new_height)
if new_height == last_height:
return(driver.page_source)
else:
last_height = new_height
except Exception as e:
print(e)
break

def prod_vitals(soup,title,url):
count_of_items=1
products_data = []                                                        # Array to store all product data for our excel sheet
for div in soup.find_all('div', class_ = 'product-tile'):                            # Iterate over each individual product-tile div tag
if count_of_items

Подробнее здесь: [url]https://stackoverflow.com/questions/79051682/getting-index-out-of-range-error-while-trying-to-scrape-product-code-from-a-webs[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибка получения индекса за пределами диапазона при попытке очистить код продукта с веб-сайта (с использованием Python и

Последнее сообщение Anonymous « 03 окт 2024, 20:54
Добавлено в форуме Python

Anonymous » 03 окт 2024, 20:54 » в форуме Python

Описание проблемы:

Я пытаюсь автоматизировать процесс, позволяющий посетить веб-сайт и получить информацию о продуктах из топа. 100 товаров на этой странице и поместите их в файл Excel.

Пояснение кода:

У меня есть класс Webscraper , внутри...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 20:54
Ошибка получения индекса за пределами диапазона при попытке очистить код продукта с веб-сайта (с использованием Python и

Последнее сообщение Anonymous « 04 окт 2024, 08:44
Добавлено в форуме Python

Anonymous » 04 окт 2024, 08:44 » в форуме Python

Описание проблемы:
Я пытаюсь автоматизировать процесс, с помощью которого я могу посетить веб-сайт и получить информацию о 100 самых популярных продуктах на этой странице и разместить его в файле Excel.
Объяснение кода:
У меня есть класс...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
04 окт 2024, 08:44
Ошибка получения индекса за пределами диапазона при попытке очистить код продукта с веб-сайта (с использованием Python и

Последнее сообщение Anonymous « 04 окт 2024, 10:50
Добавлено в форуме Python

Anonymous » 04 окт 2024, 10:50 » в форуме Python

Описание проблемы:
Я пытаюсь автоматизировать процесс, с помощью которого я могу посетить веб-сайт и получить информацию о 100 самых популярных продуктах на этой странице и разместить его в файле Excel.
Объяснение кода:
У меня есть класс...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
04 окт 2024, 10:50
Ошибка получения индекса за пределами диапазона при попытке очистить код продукта с веб-сайта (с использованием Python и

Последнее сообщение Anonymous « 05 окт 2024, 11:48
Добавлено в форуме Python

Anonymous » 05 окт 2024, 11:48 » в форуме Python

Описание проблемы:
Я пытаюсь автоматизировать процесс, с помощью которого я могу посетить веб-сайт и получить информацию о 100 самых популярных продуктах на этой странице и разместить его в файле Excel.
Объяснение кода:
У меня есть класс...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
05 окт 2024, 11:48
Ошибка получения индекса за пределами диапазона при попытке очистить код продукта с веб-сайта (с использованием Python и

Последнее сообщение Anonymous « 14 окт 2024, 17:45
Добавлено в форуме Python

Anonymous » 14 окт 2024, 17:45 » в форуме Python

Описание проблемы:
Я пытаюсь автоматизировать процесс, с помощью которого я могу посетить веб-сайт и получить подробную информацию о 100 самых популярных продуктах на этой странице и разместить его в файле Excel.
Объяснение кода:
У меня есть...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
14 окт 2024, 17:45

Вернуться в «Python»