New York Times News Scraping с использованием Pure Python и Selenium (через RPAframework)

New York Times News Scraping с использованием Pure Python и Selenium (через RPAframework) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

New York Times News Scraping с использованием Pure Python и Selenium (через RPAframework)

Цитата

Сообщение Anonymous » 11 апр 2025, 23:44

Я пытаюсь отказаться от результатов поиска в New York Times, используя Pure Python и Selenium (через RPAframework), но я не понимаю его правильно. Мне нужно получить название, дату и описание. Here is my code so far
When I print the title I'm getting this error
selenium.common.exceptions.InvalidArgumentException: Message: unknown variant //h4[@class='css-2fgx4k'], expected one of css selector, link text, partial link Текст , имя тега , xpath в строке 1 столбец 37

Код: Выделить всё

from RPA.Browser.Selenium import Selenium

# Search term
search_term = "climate change"

# Open the NY Times search page and search for the term
browser = Selenium()
browser.open_available_browser("https://www.nytimes.com/search?query=" + search_term)

# Find all the search result articles
articles = browser.find_elements("//ol[@data-testid='search-results']/li")

# Extract title, date, and description for each article and add to the list
for article in articles:
# Extract the title
title = article.find_element("//h4[@class='css-2fgx4k']")
print(title)

# Close the browser window
browser.close_all_browsers()

Любая помощь будет оценить.

Подробнее здесь: https://stackoverflow.com/questions/762 ... aframework

1744404274

Anonymous

 Я пытаюсь отказаться от результатов поиска в New York Times, используя Pure Python и Selenium (через RPAframework), но я не понимаю его правильно. Мне нужно получить название, дату и описание. Here is my code so far
When I print the title I'm getting this error
[b]selenium.common.exceptions.InvalidArgumentException: Message: unknown variant //h4[@class='css-2fgx4k'], expected one of css selector, link text, partial link Текст , имя тега , xpath  в строке 1 столбец 37 [/b] 
[code]from RPA.Browser.Selenium import Selenium

# Search term
search_term = "climate change"

# Open the NY Times search page and search for the term
browser = Selenium()
browser.open_available_browser("https://www.nytimes.com/search?query=" + search_term)

# Find all the search result articles
articles = browser.find_elements("//ol[@data-testid='search-results']/li")

# Extract title, date, and description for each article and add to the list
for article in articles:
# Extract the title
title = article.find_element("//h4[@class='css-2fgx4k']")
print(title)

# Close the browser window
browser.close_all_browsers()

[/code]
Любая помощь будет оценить.  

Подробнее здесь: [url]https://stackoverflow.com/questions/76207052/new-york-times-news-scraping-using-pure-python-and-seleniumvia-rpaframework[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как соскрести полный контент статьи New York Times, используя Selenium и Beautifulsoup, не запуская сообщение «Пожалуйст

Последнее сообщение Anonymous « 18 апр 2025, 10:14
Добавлено в форуме Python

Anonymous » 18 апр 2025, 10:14 » в форуме Python

Я строю скребок, который получает полный контент статьи из New York Times, используя как API, поиск в статье, так и HTML-скребок на основе Selenium на основе Selenium. Моя цель состоит в том, чтобы извлечь полный текст статьи для новостей, связанных...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
18 апр 2025, 10:14
Как соскрести полный контент статьи New York Times, используя Selenium и Beautifulsoup, не запуская сообщение «Пожалуйст

Последнее сообщение Anonymous « 18 апр 2025, 10:14
Добавлено в форуме Javascript

Anonymous » 18 апр 2025, 10:14 » в форуме Javascript

Я строю скребок, который получает полный контент статьи из New York Times, используя как API, поиск в статье, так и HTML-скребок на основе Selenium на основе Selenium. Моя цель состоит в том, чтобы извлечь полный текст статьи для новостей, связанных...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
18 апр 2025, 10:14
Как использовать New York Extra Large в SwiftUI в качестве системного шрифта?

Последнее сообщение Anonymous « 14 июл 2024, 08:54
Добавлено в форуме IOS

Anonymous » 14 июл 2024, 08:54 » в форуме IOS

Я хочу использовать шрифты New York Extra Large, New York Small и т. д. в SwiftUI, поскольку они имеют определенный оптический размер.
Я знаю Я могу использовать New York в качестве системного шрифта через .serif, так как я могу получить доступ к...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
14 июл 2024, 08:54
Ошибка создания отчета в формате PDF с использованием JasperReports со шрифтом Times New Roman [дубликат]

Последнее сообщение Anonymous « 16 окт 2024, 14:45
Добавлено в форуме JAVA

Anonymous » 16 окт 2024, 14:45 » в форуме JAVA

Я использую jasperreports для экспорта файла PDF. Для моего отчета нужен шрифт Times New Roman, но когда я пытаюсь экспортировать PDF-файл, некоторые символы не отображаются. Если я перейду на шрифт Dejavu Sans, все будет хорошо. Когда я...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
16 окт 2024, 14:45
Svelte: шрифт Times New Roman не применяется к математическим выражениям в OpenWebUI [дубликат]

Последнее сообщение Anonymous « 29 сен 2024, 02:55
Добавлено в форуме CSS

Anonymous » 29 сен 2024, 02:55 » в форуме CSS

Я настраиваю проект OpenWebUI, который использует Svelte в качестве внешнего интерфейса, и хочу отображать математические выражения (числа, переменные и операторы) шрифтом Times New Roman. Однако, несмотря на внесение изменений в компоненты CSS и...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
29 сен 2024, 02:55

Вернуться в «Python»