R веб-скрапинг: извлечение множественной информации с нескольких страницHtml

Программисты Html
Ответить
Anonymous
 R веб-скрапинг: извлечение множественной информации с нескольких страниц

Сообщение Anonymous »

Я пытаюсь получить все предложения всех конгрессменов, в которых они участвовали.
Я извлек имя и политические данные

Код: Выделить всё

library(tidyverse)
library(rvest)
library(chromote)
library(purrr)

sess %
html_text2(),
Partido = sess %>%
html_elements(".Card-Theme") %>%
html_text2(),
Comision = sess %>%
html_elements(".Card-Comision") %>%
html_text2(),
Curul = sess %>%
html_elements(".Card-Curul") %>%
html_text2()
)
Далее я начинаю получать все ссылки для каждого конгрессмена:

Код: Выделить всё

congresista_links = sess %>%
html_elements('a[href^="../congresista-perfil"]') %>%
html_attr("href") %>%
url_absolute("https://congresoalamano.elespectador.com/")
Наконец, я получаю информацию о предложении по всем ранее полученным ссылкам

Код: Выделить всё

get_propuestas %
paste(collapse = "//")

return(congre_prop)
}
Я протестировал код с одной ссылкой из congresista_links, и он работает, но я не уверен, связана ли проблема с использованием нескольких ссылок. Вот в чем проблема:

Код: Выделить всё

> congre_page = read_html_live(congresista_links)
Unhandled promise error: code: -32602
message: Invalid parameters
data: Failed to deserialize params.url - BINDINGS: string value expected at position 12
Error: Chromote: timed out waiting for event Page.loadEventFired
Мне очень жаль, если этот вопрос простой. Я новичок в таком подходе к получению информации

Подробнее здесь: https://stackoverflow.com/questions/798 ... iple-pages
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»