Безголовая строка парсера Chrome и HTML

Безголовая строка парсера Chrome и HTML ⇐ Python

1 сообщение • Страница 1 из 1

Гость

Цитата

Сообщение Гость » 07 мар 2024, 13:37

I'm currently using selenium and BeautifulSoup to scrape a website but I'm running into two major issues, first of all, I can't get Chrome to launch in headless mode and it says there are multiple unexpected ends of inputs (photo of said errors). The other problem I have is that I keep getting an error on the line that contains "html.parser" saying that a 'str' is not a callable object. Any advice on these issues would be greatly appreciated thank you.
from selenium import webdriver from selenium.webdriver.chrome.options import Options import urllib.request import lxml import html5lib import time from bs4 import BeautifulSoup #config options options = Options() options.headless = True # Set the URL you want to webscrape from url = 'https://tokcount.com/?user=mrsam993' # Connect to the URL browser = webdriver.Chrome(options=options, executable_path='D:\chromedriver') #chrome_options=options browser.get(url) # Parse HTML and save to BeautifulSoup object soup = BeautifulSoup(browser.page_source(), "html.parser") browser.quit() # for i in range(10): links = soup.findAll('span', class_= 'odometer-value') print(links)

Источник: https://stackoverflow.com/questions/686 ... ser-string

1709807871

Гость


I'm currently using selenium and BeautifulSoup to scrape a website but I'm running into two major issues, first of all, I can't get Chrome to launch in headless mode and it says there are multiple unexpected ends of inputs (photo of said errors). The other problem I have is that I keep getting an error on the line that contains "html.parser" saying that a 'str' is not a callable object. Any advice on these issues would be greatly appreciated thank you.
 from selenium import webdriver from selenium.webdriver.chrome.options import Options import urllib.request import lxml import html5lib import time from bs4 import BeautifulSoup #config options options = Options() options.headless = True # Set the URL you want to webscrape from url = 'https://tokcount.com/?user=mrsam993' # Connect to the URL browser = webdriver.Chrome(options=options, executable_path='D:\chromedriver') #chrome_options=options browser.get(url) # Parse HTML and save to BeautifulSoup object soup = BeautifulSoup(browser.page_source(), "html.parser") browser.quit() # for i in range(10): links = soup.findAll('span', class_= 'odometer-value') print(links)  

Источник: [url]https://stackoverflow.com/questions/68641383/headless-chrome-and-html-parser-string[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Безголовая печать PDF-файлов Chrome с сеансом

Последнее сообщение Anonymous « 29 апр 2024, 03:45
Добавлено в форуме JAVA

Anonymous » 29 апр 2024, 03:45 » в форуме JAVA

Я пытаюсь интегрировать в свой проект инструмент Headless Chrome для создания отчетов в формате PDF. Однако мне удалось сгенерировать PDF-файл, поскольку для отображения html-отчета на странице требуется сеанс пользователя. Когда я использую команду...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
29 апр 2024, 03:45
HTML getnext с использованием парсера lxml

Последнее сообщение Anonymous « 25 май 2024, 03:13
Добавлено в форуме Python

Anonymous » 25 май 2024, 03:13 » в форуме Python

Я пытаюсь проанализировать страницу с HTML-кодом, как показано ниже:

..
Identified Header...

...
...
...

..

Я использую код Python для анализа страницы с помощью анализатора lxml. Я могу определить идентификатор указанного элемента с...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
25 май 2024, 03:13
BeautifulSoup извлекает и анализирует данные — от European Volunteering-Services: крошечного парсера, который собирает в

Последнее сообщение Гость « 13 мар 2024, 19:19
Добавлено в форуме Python

Гость » 13 мар 2024, 19:19 » в форуме Python

Я ищу публичный список волонтерских услуг в Европе: мне нужны не полные адреса, а название и веб-сайт. Я думаю о данных... XML, CSV... с такими полями: имя, страна - и еще какими-то полями, было бы неплохо по одной записи на страну присутствия....

0 Ответы

46 Просмотры

Последнее сообщение Гость
13 мар 2024, 19:19
Длительная работа парсера PHP возвращает 500 внутренних ошибок

Последнее сообщение Anonymous « 28 июн 2024, 08:12
Добавлено в форуме Php

Anonymous » 28 июн 2024, 08:12 » в форуме Php

В основном я нахожу ответы на свои вопросы в Google, но теперь я застрял.
Я работаю над парсерным скриптом, который сначала собирает некоторые имена пользователей веб-сайта, а затем получает все детали пользователь. задействованы два парсера: первый...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
28 июн 2024, 08:12
Получить родительский парсер из парсера argparse

Последнее сообщение Anonymous « 13 июл 2024, 15:20
Добавлено в форуме Python

Anonymous » 13 июл 2024, 15:20 » в форуме Python

У меня есть определенный код Python, который принимает аргументы CLI и обрабатывает их с помощью анализатора argparse. У меня есть родительский парсер:
verbose_quiet_parent_parser = argparse.ArgumentParser(add_help=False)

И у меня есть парсер,...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
13 июл 2024, 15:20

Вернуться в «Python»