Я пытаюсь отредактировать код, чтобы сохранить капчи, в надежде в конечном итоге написать бота для автоматизации. Следующий код Python приводит к последующей ошибке.
import requests
from selenium import webdriver
from selenium.webdriver.common.by import By
import urllib
import time
import os
path = "C:/Users/micha/Documents/PythonProgramming/IG"
gifname = "captcha"
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-dev-shm-usage')
driver = webdriver.Chrome(options=chrome_options)
# Create url variable containing the webpage for a Google image search.
url = ("https://www.infamousgangsters.com/site.php?page=bulletfactory")
# Find the images.
imgResults = driver.find_elements(By.XPATH,"/html/body/div/table/tbody/tr/td/table/tbody/tr/td[2]/div[@class='spacer']/table[2]/tbody/tr/td[@class='bodymain']/div[2]/form/img/@src")
# Access and store the scr list of image url's.
src = []
for img in imgResults:
src.append(img.get_attribute('src'))
# Retrieve and download the images.
for i in range(len(src)): urllib.request.urlretrieve(str(src[i]),"sample_data/captchas{}.gif".format(i))
with open(os.path.join(path, gifname), 'wb') as f:
driver.close()
Будем очень признательны за любую помощь или совет.
Я пытаюсь отредактировать код, чтобы [b]сохранить капчи[/b], в надежде в конечном итоге написать бота для автоматизации. Следующий код Python приводит к последующей ошибке. [code]import requests from selenium import webdriver from selenium.webdriver.common.by import By import urllib import time import os
path = "C:/Users/micha/Documents/PythonProgramming/IG" gifname = "captcha" chrome_options = webdriver.ChromeOptions() chrome_options.add_argument('--headless') chrome_options.add_argument('--no-sandbox') chrome_options.add_argument('--disable-dev-shm-usage') driver = webdriver.Chrome(options=chrome_options) # Create url variable containing the webpage for a Google image search. url = ("https://www.infamousgangsters.com/site.php?page=bulletfactory") # Find the images. imgResults = driver.find_elements(By.XPATH,"/html/body/div/table/tbody/tr/td/table/tbody/tr/td[2]/div[@class='spacer']/table[2]/tbody/tr/td[@class='bodymain']/div[2]/form/img/@src") # Access and store the scr list of image url's. src = [] for img in imgResults: src.append(img.get_attribute('src')) # Retrieve and download the images. for i in range(len(src)): urllib.request.urlretrieve(str(src[i]),"sample_data/captchas{}.gif".format(i)) with open(os.path.join(path, gifname), 'wb') as f: driver.close() [/code] Будем очень признательны за любую помощь или совет.
Я использую Selenium и Python для сбора данных с веб-сайта iHerb. Однако я столкнулся с капчей, которая не позволяет мне успешно извлечь нужную информацию. Как мне преодолеть эту проблему с капчей и продолжить процесс очистки?
Я пытался использовать...
да, я работаю над ботом, где нам нужно заполнить капчу, чтобы начать, но я не могу найти элемент, на который нужно настроить таргетинг, потому что он имеет уникальный идентификатор, который при каждой загрузке страницы и его родственный элемент...
Я пытаюсь получить список авторов с этого URL-адреса:
И он захватывает только 3 авторов, с четвертый при выводе усекается до эллипса.
Вот код:
import csv
import requests
from bs4 import BeautifulSoup
Я хочу получить данные с веб-сайта для их анализа, но не уверен в правильности подхода.
Это веб-сайт
пожалуйста, посмотрите.
И мой желаемый результат может быть примерно таким.
Пожалуйста, помогите мне, так как я уже давно застрял в этом, я...
Я пытаюсь очистить веб -приложение, чтобы получить значения таблицы. Как соскрести таблицу каждый раз, когда новые значения добавляются в таблицу или иным образом, как я могу соскрести веб -сайт? Веб -сайт
Мой базовый код позволяет мне только...