Rvest가있는 일부 웹 사이트에서 셀렉터를 사용할 수없는 이유를 이해할 수 없습니다.노드가 html_nodes로 탐지되지 않음
예 :
url <- read_html("http://www.cbc.ca/news/politics")
headlines <- url %>%
html_nodes(".headline") %>%
html_text()
또 다른 예 :
library(RSelenium)
rD <- rsDriver(verbose = FALSE)
rD
remDr <- rD$client
url <- "http://www.cbc.ca/news/politics"
remDr$navigate(url)
remDr$getTitle()
remDr$getCurrentUrl()
webElem <- remDr$findElement(using = "class", value = 'headline')
webElem$getElementAttribute("class")
remDr$close()
rD$server$stop()
그것은 아주 간단해야한다. 구조를 볼 때 제목은 클래스 제목 아래에 있습니다. 그 위에는 클래스 카드 콘텐츠, 카드 콘텐츠 상단이 있지만 CSS 선택기 나 xpath 조합은 작동하지 않는 것으로 보입니다.
내가 더 클래스 헤드 라인이나 클래스 카드의 콘텐츠를 볼 수 없습니다 – lukeA
, 그것은 거기 . SelectorGadget을 사용하는 경우에도 식별 된 CSS 선택기입니다. – Monduiz