R веб-скрапинг: извлечение множественной информации с нескольких страниц

R веб-скрапинг: извлечение множественной информации с нескольких страниц ⇐ Html

1 сообщение • Страница 1 из 1

Anonymous

R веб-скрапинг: извлечение множественной информации с нескольких страниц

Сообщение Anonymous » 05 фев 2026, 15:31

Я пытаюсь получить все предложения всех конгрессменов, в которых они участвовали.
Я извлек имя и политические данные

library(tidyverse)
library(rvest)
library(chromote)
library(purrr)

sess %
html_text2(),
Partido = sess %>%
html_elements(".Card-Theme") %>%
html_text2(),
Comision = sess %>%
html_elements(".Card-Comision") %>%
html_text2(),
Curul = sess %>%
html_elements(".Card-Curul") %>%
html_text2()
)

Далее я начинаю получать все ссылки для каждого конгрессмена:

Код: Выделить всё

congresista_links = sess %>%
html_elements('a[href^="../congresista-perfil"]') %>%
html_attr("href") %>%
url_absolute("https://congresoalamano.elespectador.com/")

Наконец, я получаю информацию о предложении по всем ранее полученным ссылкам

Код: Выделить всё

get_propuestas %
paste(collapse = "//")

return(congre_prop)
}

Я протестировал код с одной ссылкой из congresista_links, и он работает, но я не уверен, связана ли проблема с использованием нескольких ссылок. Вот в чем проблема:

Код: Выделить всё

> congre_page = read_html_live(congresista_links)
Unhandled promise error: code: -32602
message: Invalid parameters
data: Failed to deserialize params.url - BINDINGS: string value expected at position 12
Error: Chromote: timed out waiting for event Page.loadEventFired

Мне очень жаль, если этот вопрос простой. Я новичок в таком подходе к получению информации

Подробнее здесь: https://stackoverflow.com/questions/798 ... iple-pages

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «Html»