Amazon Web Scraping с Python [закрыто] - Цифровое Кемерово

Amazon Web Scraping с Python [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 08 май 2025, 06:29

Я соскребаю страницу Amazon, используя Python и сохраняю результат в файл CSV. Этот код работает хорошо, но проблема в том, что я получаю некоторые имена продуктов без первого слова.
Так, например, здесь я получаю только:
«Шуко-стекдоз, eu-standard 1 fach unterputz mit 2,5d изогнутый платте, Wandsteckdose weiã 86 * 86mm», но он должен быть «o schuk schuk o schuk o schuk ro Unterputz MIT 2,5d Изогнутый Glas Platte, WandSteckDose weiã 86 * 86 мм "
[Ввод изображение описание здесь] [1] < /p>
Вот мой код: < /p>
import requests
from bs4 import BeautifulSoup
import pandas as pd
from time import sleep

headers = {
'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/135.0.0.0 Safari/537.36',
'Accept-Language': 'de-DE, de;q=0.5'
}

search_query = 'steckdose'.replace(' ', '+')
base_url = 'https://www.amazon.de/s?k={0}'.format(search_query)

items = []
for i in range(1, 2):
print('Processing {0}...'.format(base_url + '&page={0}'.format(i)))
response= requests.get(base_url + '&page={0}'.format(i), headers = headers)

if response.status_code !=200:
print(f"Error: {response.status_code}")
continue

soup = BeautifulSoup(response.content, 'html.parser')
results = soup.find_all('div', {'data-component-type': 's-search-result'})

if not results:
print('No results found')
continue

for result in results:
try:
# Find the tag first
link = result.find('a', class_='a-link-normal s-line-clamp-4 s-link-style a-text-normal')
if link:
# Extract product name from the tag inside
product_name = link.find('h2').find('span').text.strip() # Get text from
product_url = 'https://www.amazon.de' + link['href']
items.append([product_name, product_url])
except AttributeError:
continue

sleep(1.5)

df = pd.DataFrame(items, columns=['product', 'product url'])
df.to_csv('{0}.csv'.format(search_query), index = False)

Подробнее здесь: https://stackoverflow.com/questions/796 ... ith-python

1746674983

Anonymous

 Я соскребаю страницу Amazon, используя Python и сохраняю результат в файл CSV. Этот код работает хорошо, но проблема в том, что я получаю некоторые имена продуктов без первого слова.
Так, например, здесь я получаю только:
«Шуко-стекдоз, eu-standard 1 fach unterputz mit 2,5d изогнутый платте, Wandsteckdose weiã 86 * 86mm», но он должен быть «o schuk schuk o schuk o schuk ro Unterputz MIT 2,5d Изогнутый Glas Platte, WandSteckDose weiã 86 * 86 мм "
[Ввод изображение описание здесь] [1] < /p>
Вот мой код: < /p>
import requests
from bs4 import BeautifulSoup
import pandas as pd
from time import sleep

headers = {
'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/135.0.0.0 Safari/537.36',
'Accept-Language': 'de-DE, de;q=0.5'
}

search_query = 'steckdose'.replace(' ', '+')
base_url = 'https://www.amazon.de/s?k={0}'.format(search_query)

items = []
for i in range(1, 2):
print('Processing {0}...'.format(base_url + '&page={0}'.format(i)))
response= requests.get(base_url + '&page={0}'.format(i), headers = headers)

if response.status_code !=200:
print(f"Error:  {response.status_code}")
continue

soup = BeautifulSoup(response.content, 'html.parser')
results = soup.find_all('div', {'data-component-type': 's-search-result'})

if not results:
print('No results found')
continue

for result in results:
try:
# Find the  tag first
link = result.find('a', class_='a-link-normal s-line-clamp-4 s-link-style a-text-normal')
if link:
# Extract product name from the  tag inside 
product_name = link.find('h2').find('span').text.strip()  # Get text from 
product_url = 'https://www.amazon.de' + link['href']
items.append([product_name, product_url])
except AttributeError:
continue

sleep(1.5)

df = pd.DataFrame(items, columns=['product', 'product url'])
df.to_csv('{0}.csv'.format(search_query), index = False)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79606645/amazon-web-scraping-with-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Amazon Web Scraping с Python

Последнее сообщение Anonymous « 05 май 2025, 12:57
Добавлено в форуме Python

Anonymous » 05 май 2025, 12:57 » в форуме Python

Я соскребаю страницу Amazon, используя Python и сохраняю результат в файл CSV. Этот код работает хорошо, но проблема в том, что я получаю некоторые имена продуктов без первого слова.
Так, например, здесь я получаю только:
«Шуко-стекдоз, eu-standard...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
05 май 2025, 12:57
Amazon Scraping возвращает 503

Последнее сообщение Anonymous « 29 янв 2025, 18:13
Добавлено в форуме Python

Anonymous » 29 янв 2025, 18:13 » в форуме Python

Я использую BeautifulSoup и использую пользовательский агент при выполнении запроса. Amazon блокирует мои звонки, хотя я добавил метод сна, чтобы избежать его. Есть ли в любом случае, чтобы справиться с этим? Я знаю, что есть API, но я сомневаюсь,...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
29 янв 2025, 18:13
Amazon Scraping возвращает 503

Последнее сообщение Anonymous « 29 янв 2025, 20:41
Добавлено в форуме Python

Anonymous » 29 янв 2025, 20:41 » в форуме Python

Я использую BeautifulSoup и использую пользовательский агент при выполнении запроса. Amazon блокирует мои звонки, хотя я добавил метод сна, чтобы избежать его. Есть ли в любом случае, чтобы справиться с этим? Я знаю, что есть API, но я сомневаюсь,...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
29 янв 2025, 20:41
PHP Web Scraping - Зачем Керл внезапно перестать работать? [закрыто]

Последнее сообщение Anonymous « 07 июн 2025, 21:21
Добавлено в форуме Php

Anonymous » 07 июн 2025, 21:21 » в форуме Php

Я в течение многих лет соскребал веб -страницу с Curl, используя эту программу, но она вдруг больше не работает. Любые предложения о том, как продолжать использовать эту страницу? 1);
curl_setopt ($ ch, curlopt_followlocation, 1);
curl_setopt ($...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
07 июн 2025, 21:21
PHP Web Scraping - Зачем Керл внезапно перестать работать? [закрыто]

Последнее сообщение Anonymous « 07 июн 2025, 23:48
Добавлено в форуме Php

Anonymous » 07 июн 2025, 23:48 » в форуме Php

Я в течение многих лет соскребал веб -страницу с Curl, используя эту программу, но она вдруг больше не работает. Есть предложения о том, как продолжать использовать эту страницу?
$ch = curl_init();

curl_setopt($ch, CURLOPT_URL,

curl_setopt($ch,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
07 июн 2025, 23:48

Вернуться в «Python»