2014-06-23 6 views
-1

R을 사용하여 다음 2 개월 동안의 데이터를 예측할 수있는 CSV 파일로 지난 10 개월의 데이터가 있습니다. Kindly 초보자입니다. 내가 한 일은 :지난 2 개월 동안의 데이터를 지난 10 개월 동안의 데이터로 예측합니다.

  1. 파일에서 데이터를 읽습니다.
  2. 절반 데이터를 'train'변수에, 나머지 절반을 'test'에 넣습니다. 내가 바른 길에 또는 아닙니다 경우
  3. Model<-lm(data=train)
  4. prediction<-predict(Model,newdata=test)

친절하게 도와 드릴까요? 친절하게 정교하게. 사전에 감사드립니다. 도움말은 사무실 업무로서 큰 도움이 될 것이며 누구도 도움을 줄 수 없습니다.

+1

그럼 ... 작동 했습니까? IMHO 적절한 모델은 데이터와 프로세스에 따라 크게 달라집니다. 트렌드가 선형이면 작동 할 수 있습니다. 이 방법으로 날씨를 예측하지 마십시오 :-) – mlt

+0

모든 것이 쉬운 경우 아무도 통계학자를 고용 할 필요가 없습니다. 나는 어떤 predioction을 생각하기도 전에 [적합 모델 검증] (http://www.statmethods.net/stats/rdiagnostics.html)을 시작할 것입니다. –

+0

고맙습니다. 친절하게이 목적을 위해 나를 도울 수있는 독서물을 제안 해주십시오. –

답변

0

불과 10 개월 간의 (월별) 데이터를 예측하려는 경우 이와 같이 적은 수의 관찰이므로 사용자가 제시하는 모델은 매우 정확하지 않을 수 있습니다. 또한 교육 및 테스트 세트로 데이터를 분할하는 데 신경 쓰지 않을 것입니다. 10 개월의 데이터는 모델을 훈련하는 경우에도 매우 희소합니다. 또한 최소 2 년의 데이터가 없어도 계열을 다른 구성 요소 (계절,주기, 추세, 오류)로 분해 할 수는 없습니다. 그러나 R의 여러 모델링 기능을 사용하여 확실히 놀 수 있으며 데이터의 일반적인 추세 또는 패턴을 식별 할 수 있습니다. 예 :

install.packages("forecast",dependencies=TRUE) 
library(forecast) 
t0 <- as.Date("2013-06-01",format="%Y-%m-%d") # Initial month 
## 
# Some data 
set.seed(1000) 
Data <- data.frame(
     Date=seq.Date(from=t0,by='month',length.out=10), 
     Value=(cumsum(rnorm(10,3,2))+rnorm(10)) 
) 
## 
tData <- ts(Data$Value, 
     start=c(2013,6), 
     frequency=12 
) 
## 
# Try using auto.arima() to fit an autoregressive model 
Mod1 <- auto.arima(tData) 
summary(Mod1) 
# 2 period forecast 
plot(forecast(Mod1, h=2)) 
## 
## Or ets() for an exponential smoothing state space model 
Mod2 <- eta(tData) 
summary(Mod2) 
# 2 period forecast 
plot(forecast(Mod2, h=2)) 
관련 문제