좋아, 그래서 나는 단순한 웹 긁힌 자국이 될 것 같은데 붙어있다. 내 목표는 Morningstar.com을 긁어서 입력 한 URL을 기반으로 펀드 이름을 검색하는 것입니다. 여기에 내 코드의 예는 다음과 같습니다R 웹 긁힘 - 오류
library(rvest)
url <- html("http://www.morningstar.com/funds/xnas/fbalx/quote.html")
url %>%
read_html() %>%
html_node('r_title')
나는 그것이 이름 피델리티 균형 기금을 반환 할 것으로 예상, 대신 나는 다음과 같은 오류 얻을 것이다 : {xml_missing}
제안?
아론
편집 :
가 나는 또한 XHR 요청을 통해 긁어 시도,하지만 난 내 문제는 적절한 데이터를 찾기 위해 선택하는 어떤 CSS 선택기 또는 XPath를 모르는 생각합니다.
XHR 코드 :
는get.morningstar.Table1 <- function(Symbol.i,htmlnode){
try(res <- GET(url = "http://quotes.morningstar.com/fundq/c-header",
query = list(
t=Symbol.i,
region="usa",
culture="en-US",
version="RET",
test="QuoteiFrame"
)
))
tryCatch(x <- content(res) %>%
html_nodes(htmlnode) %>%
html_text() %>%
trimws()
, error = function(e) x <-NA)
return(x)
} #HTML Node in this case is a vkey
여전히 같은 문제는, 내가 찾아 올바른 CSS/XPath를 사용하고 있습니까? XHR 코드는 명확한 CSS 선택기가있는 요청에 효과적입니다.
감사합니다. –