HTML에서 긁힌 데이터

-1

이것은 내가 긁어 모으려 고 시도한 페이지, http://www.footballlocks.com/nfl_point_spreads_week_1.shtml입니다. 추가 분석을 수행 할 수 있도록 4 열의 간단한 data.frame으로 끝내고 싶습니다. XML 패키지를 사용해 보았지만 많은 행운이 없었습니다. 도움을 주셔서 감사합니다HTML에서 긁힌 데이터

week.1 <- readHTMLTable("http://www.footballlocks.com/nfl_point_spreads_week_1.shtml") 
str(week.1)

출처

2015-01-30 RcodeNFL

정확히 무엇을 시도해 보았 니? "별로 행운이 없다"는 것은 정확히 무슨 뜻입니까? 당신은 무엇을 성취 할 수 없었습니까? 지금은 특정 프로그래밍 질문을하기보다는 누군가에게 코드를 작성하도록 요청하는 것처럼 들립니다. – MrFlick

당신은 이것을 찾고 있습니까 : week.1 <- readHTMLTable ("http://www.footballlocks.com/nfl_point_spreads_week_1.shtml", = 1) – cory

나는 왜 그 사이트에 어려움을 겪고 있는지 알 수 있습니다. 많은, 많은, 많은 레벨의 중첩 테이블. 가장 나쁜. @ 코리, 그걸 시도 했니? 나는 그 데이터 프레임의 내용이 OP가 찾고있는 것 (축구는 그냥 끔찍한 사이트 일 뿐이다)을 의심한다. – hrbrmstr

실시간 NFL 확률을 원한다면 사용할 수있는 API가 있습니다. 그 웹 페이지에서 한 주간의 확률을 긁어내는 것보다 더 나은 목적 일 수 있습니다. 그것은 축구 라인 분석을 위해 일반적으로 사용되는 소스입니다.

출처

2015-01-30 16:24:50

rvest 이렇게 할 수 있습니다. 당신은 thusly 히 모든 4 열 테이블을 찾기 위해 XPath를 사용할 수 있습니다

library(rvest) 

url <- "http://www.footballlocks.com/nfl_point_spreads_week_1.shtml" 

pg <- html(url) 

tabs <- pg %>% html_nodes(xpath="//table[@cols='4']") 

html_table(tabs[[1]], header=TRUE) 

## Date & Time  Favorite Spread  Underdog 
## 1 9/4 8:35 ET  At Seattle -5.0 Green Bay 
## 2 9/7 1:00 ET  New Orleans -3.0 At Atlanta 
## 3 9/7 1:00 ET At St. Louis -3.0 Minnesota 
## 4 9/7 1:00 ET At Pittsburgh -6.0 Cleveland 
## 5 9/7 1:00 ET At Philadelphia -10.0 Jacksonville 
## 6 9/7 1:00 ET  At NY Jets -6.5  Oakland 
## 7 9/7 1:00 ET At Baltimore -1.0 Cincinnati 
## 8 9/7 1:00 ET  At Chicago -7.0  Buffalo 
## 9 9/7 1:00 ET  At Houston -3.0 Washington 
## 10 9/7 1:00 ET At Kansas City -3.0 Tennessee 
## 11 9/7 1:00 ET  New England -4.0  At Miami 
## 12 9/7 4:25 ET At Tampa Bay -4.5  Carolina 
## 13 9/7 4:25 ET San Francisco -3.5 At Dallas 
## 14 9/7 8:30 ET  At Denver -8.5 Indianapolis

하나가 오래된 학교처럼 그것을 걷어 할 필요가있는 경우 :

library(XML) 

url <- "http://www.footballlocks.com/nfl_point_spreads_week_1.shtml" 

doc <- htmlParse(url) 

readHTMLTable(doc["//table[@cols='4']"][[1]])

(동일 출력)

출처

2015-01-30 16:38:13 hrbrmstr

어떤 R 버전을 사용하고 있습니까? – RcodeNFL

3.1.1을 사용하고 있으며 패키지를 사용할 수 없습니다. 제안 사항은 무엇입니까? – RcodeNFL

'rvest'의'DESCRIPTION' 파일에'R (> = 3.0.1)'이 있습니다. 어떻게 설치하고 있습니까? – hrbrmstr

HTML에서 긁힌 데이터

답변

관련 문제