불과 10 개월 간의 (월별) 데이터를 예측하려는 경우 이와 같이 적은 수의 관찰이므로 사용자가 제시하는 모델은 매우 정확하지 않을 수 있습니다. 또한 교육 및 테스트 세트로 데이터를 분할하는 데 신경 쓰지 않을 것입니다. 10 개월의 데이터는 모델을 훈련하는 경우에도 매우 희소합니다. 또한 최소 2 년의 데이터가 없어도 계열을 다른 구성 요소 (계절,주기, 추세, 오류)로 분해 할 수는 없습니다. 그러나 R의 여러 모델링 기능을 사용하여 확실히 놀 수 있으며 데이터의 일반적인 추세 또는 패턴을 식별 할 수 있습니다. 예 :
install.packages("forecast",dependencies=TRUE)
library(forecast)
t0 <- as.Date("2013-06-01",format="%Y-%m-%d") # Initial month
##
# Some data
set.seed(1000)
Data <- data.frame(
Date=seq.Date(from=t0,by='month',length.out=10),
Value=(cumsum(rnorm(10,3,2))+rnorm(10))
)
##
tData <- ts(Data$Value,
start=c(2013,6),
frequency=12
)
##
# Try using auto.arima() to fit an autoregressive model
Mod1 <- auto.arima(tData)
summary(Mod1)
# 2 period forecast
plot(forecast(Mod1, h=2))
##
## Or ets() for an exponential smoothing state space model
Mod2 <- eta(tData)
summary(Mod2)
# 2 period forecast
plot(forecast(Mod2, h=2))
그럼 ... 작동 했습니까? IMHO 적절한 모델은 데이터와 프로세스에 따라 크게 달라집니다. 트렌드가 선형이면 작동 할 수 있습니다. 이 방법으로 날씨를 예측하지 마십시오 :-) – mlt
모든 것이 쉬운 경우 아무도 통계학자를 고용 할 필요가 없습니다. 나는 어떤 predioction을 생각하기도 전에 [적합 모델 검증] (http://www.statmethods.net/stats/rdiagnostics.html)을 시작할 것입니다. –
고맙습니다. 친절하게이 목적을 위해 나를 도울 수있는 독서물을 제안 해주십시오. –