Очистка селена продолжает возвращать ValueError: недопустимый литерал для int() с базой 10: ''Python

Программы на Python
Ответить Пред. темаСлед. тема
Гость
 Очистка селена продолжает возвращать ValueError: недопустимый литерал для int() с базой 10: ''

Сообщение Гость »


При попытке парсинга веб-сайта они не могут найти текст в моей переменной индексирования страниц. Функция len() для нумерации страниц показывает правильное число, поэтому я знаю, что она нашла нужный мне элемент. Только не текст в нем. Если кто-то сможет мне помочь, я буду признателен.

Код: Выделить всё

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.chrome.options import Options # ALLOWS PROGRAM TO RUN W/O WINDOW OPENING
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

import pandas as pd
import time
# THESE TURN ON HEADLESS MODE
options = Options()
options.add_argument("--headless=new")
options.add_argument("window-size=1920x1080")

# THESE ACCESS THE WEBSITE AND PULL DATA
web = "https://www.audible.com/adblbestsellers?page=1&ref_pageloadid=vungFE9JcaT4XEUq&ref=a_adblbests_c5_pageNum_0&pf_rd_p=3c1c017b-585f-4bde-98c6-e3cb784e4b8e&pf_rd_r=CTE7EBFZPGVW9C9MJYWQ&pageLoadId=ViHKKYBoSP03JQKv&creativeId=0bf0e03f-bb55-481b-b4fd-d67375977170"
driver = webdriver.Chrome(options= options)
driver.get(web)
# driver.maximize_window()

# PAGINATION
pagination = WebDriverWait(driver, 5).until(EC.presence_of_element_located((By.XPATH,'.//ul[contains(@class, "pagingElements")]')))
# pagination = driver.find_element(By.XPATH,'.//ul[contains(@class, "pagingElements")]')
pages = WebDriverWait(pagination, 20).until(EC.presence_of_all_elements_located((By.CSS_SELECTOR,'a.pageNumberElement')))
#pages = pagination.find_elements(By.XPATH,'.//ul[contains(@class,"pagingElements")]/li')
last_page = int(pages[1].text)

current_page = 1

while current_page \n[/i]\n \n\n  \nGo back a page\n  \n      [/url]\n    \n  \n\n  \n\n  \n\n  \n\n\n' text='Go back a page'
Page 2 HTML='[*]\n    \n \n\n  \n1\n' text='1'
Page 3 HTML='[*]\n    [url=/adblbestsellers?page=2&ref_pageloadid=0IuRVXnX3DGs76JX&ref=a_adblbests_c5_pageNum_1&pf_rd_p=3c1c017b-585f-4bde-98c6-e3cb784e4b8e&pf_rd_r=RGEY6R11PSFH96HYBZZ1&pageLoadId=7wau2qFrQbdrOLQh&creativeId=0bf0e03f-bb55-481b-b4fd-d67375977170]2[/url]\n' text='2'
Page 4 HTML='[*]\n    \n \n\n  \n...\n' text=''
Page 5 HTML='[*]\n    [url=/adblbestsellers?page=5&ref_pageloadid=0IuRVXnX3DGs76JX&ref=a_adblbests_c5_pageNum_3&pf_rd_p=3c1c017b-585f-4bde-98c6-e3cb784e4b8e&pf_rd_r=RGEY6R11PS FH96HYBZZ1&pageLoadId=7wau2qFrQbdrOLQh&creativeId=0bf0e03f-bb55-481b-b4fd-d67375977170]5[/url]\n' text=''
Стр. 6 HTML='[*]\n \n\n\n\n\n \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n \n \n\n\n \n \n \n \n \n \n \n\n\n \n \n \n \n\n\n\n \n\n\n\n\n\n\n\n\n\n\n\n\n\n \n \n \n [url=/adblbestsellers?page=2&ref_pageloadid=0IuRVXnX3DGs76JX&ref=a_adblbests_c5_pageNext&pf_rd_p=3c1c017b-585f-4bde-98c6-e3cb784e4b8e&pf_rd_r =RGEY6R11PSFH96HYBZZ1&pageLoadId=7wau2qFrQbdrOLQh&creativeId=0bf0e03f- bb55-481b-b4fd-d67375977170]\n \ n \n \n\n\n\n\n\n\n\n\n\n\n\n\n\t\n\t\n\t\n\t\n\n\n\ n\n\n\n\n\n[i]\n[/i]\n \n\n \nПерейти на страницу вперед\n \n [/url]\n \n \n\n \n\n \n\n \n\ n\n' text=''
Последняя страница: 1
'''
Я пытаюсь извлечь цифру "5", которая находится на HTML-странице 5


Источник: https://stackoverflow.com/questions/781 ... t-with-bas
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»