2016-12-20 2 views
2

외래 변수가 하나 인 RARIMA(0,0,1) 모델이 적합합니다.비정상 오차가있는 ARIMA 모델

피팅 후, 나는 오류 용어를 테스트하며 (이 t-distributed 오류처럼) 매우 비 정상 : enter image description here

내 질문은 : t-distributed 오류 ARIMA 모델을 맞을 수 R의 모든 패키지가 있습니까? 아니면이 문제에 대한 다른 해결책이 있습니까?

데이터가 이미 로그 변환 된 데이터이므로 다른 데이터 변환을 수행 할 수 없습니다.

미리 도움을 주셔서 감사합니다.

dput(x) 
c(1.098612289, 0, 1.791759469, 1.386294361, 0, 2.079441542, 2.772588722, 
2.564949357, 3.737669618, 3.761200116, 3.891820298, 3.555348061, 
2.944438979, 2.772588722, 1.791759469, 2.772588722, 2.564949357, 
3.258096538, 3.295836866, 2.890371758, 2.772588722, 2.197224577, 
4.077537444, 4.828313737, 5.855071922, 6.620073207, 7.561641746, 
7.887208586, 7.557472902, 6.747586527, 5.583496309, 4.465908119, 
3.526360525, 2.890371758, 2.564949357, 2.397895273, 2.302585093, 
0.693147181, 1.386294361, 0.693147181, 0.693147181, 0, 0, 1.098612289, 
0.693147181, 0, 0, 0, 0, 0, 0, 0, 0.693147181, 0.693147181, 0, 
0, 0.693147181, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0.693147181, 0, 0.693147181, 0.693147181, 1.386294361, 
0.693147181, 1.098612289, 2.564949357, 3.555348061, 4.744932128, 
4.615120517, 4.934473933, 4.779123493, 5.308267697, 5.303304908, 
5.416100402, 5.379897354, 5.153291594, 5.081404365, 4.927253685, 
4.86753445, 4.356708827, 4.060443011, 3.891820298, 3.091042453, 
3.091042453, 2.995732274, 2.302585093, 2.079441542, 1.609437912, 
0.693147181, 0, 0) 

dput(y) 
c(-2.760818612, -0.969058209, -1.374522756, -2.760817117, -0.681374268, 
0.011775716, -0.195861406, 0.976866516, 1.000404862, 1.131034014, 
0.794568131, 0.183662413, 0.011814959, -0.96901336, 0.011818696, 
-0.195818426, 0.497333426, 0.535078613, 0.129616682, 0.01183645, 
-0.5635262, 1.316797505, 2.067596972, 3.094420195, 3.859561475, 
4.801489346, 5.127554079, 4.798176537, 3.988449441, 2.824408827, 
1.706836735, 0.767295318, 0.131309734, -0.19411042, -0.361162633, 
-0.456471128, -2.065908853, -1.372761111, -2.065908104, -2.065907917, 
-2.759055098, -2.759055098, -1.660442435, -2.065907356, -2.759054536, 
-2.759054536, -2.759054536, -2.759054536, -2.759054536, -2.759054536, 
-2.759054536, -2.065907168, -2.065906981, -2.759054162, -2.759054162, 
-2.065906794, -2.759053975, -2.759053975, -2.759053975, -2.759053975, 
-2.759053975, -2.759053975, -2.759053975, -2.759053975, -2.759053975, 
-2.759053975, -2.759053975, -2.759053975, -2.759053975, -2.759053975, 
-2.759053975, -2.759053975, -2.759053975, -2.759053975, -2.065906607, 
-2.759053787, -2.06590642, -2.065906232, -1.37275849, -2.065905484, 
-1.660440001, -0.194100686, 0.796304383, 1.985909791, 1.856116899, 
2.17549615, 2.020167801, 2.549349637, 2.544424292, 2.657261726, 
2.621099122, 2.394525569, 2.3226683, 2.168543275, 2.108848197, 
1.598036993, 1.301781851, 1.133168127, 0.332394215, 0.332398148, 
0.237091526, -0.456053969, -0.679196209, -1.149199089, -2.065489634, 
-2.758636814, -2.758636814, -2.758636814) 

그리고 내 코드 :

y1 = y 
x_data1 = matrix(c(x), ncol = 1) 
ts_mod1 = arima(y1, order = c(0,0,1), xreg = x_data1) 
ts_res1 = ts_mod1$residuals 

qqnorm(ts_res1, main = "", cex.axis = 1.2, cex.lab = 1.45) 
qqline(ts_res1, col = "red") 
+0

그것은 당신의 probelm 도움을 복제 쉽게되도록 데이터를 공유하시기 바랍니다. dput을 사용하여 데이터와 값의 구조를 알려주십시오. 이 데이터는 높은 이분 산성을 가지고있는 것으로 보입니다. –

답변

0

이 Q-Q 플롯이 heavy - tailed distribution 나타내는 여기


는 데이터입니다. this question을 참조하면 q-q 플롯의 다양한 유형을 이해할 수 있습니다. 질문에 대답하기 위해 비표준 배포를 다루는 더 나은 작업을 수행하는 패키지가 있습니다. forecast 패키지 시도 -

require('forecast') 
ts_mod1 <- auto.arima(y1,xreg = x_data1) 
ts_mod1 

# Series: y1 
# ARIMA(4,0,2) with non-zero mean 
# 
# Coefficients: 
#  ar1  ar2  ar3  ar4  ma1  ma2 intercept x_data1 
# 0.7269 -0.3027 0.2060 -0.0391 -0.6260 0.4672 -2.4920 0.8695 
# s.e. 0.4409 0.4004 0.1771 0.1796 0.4577 0.3664  0.2536 0.1102 
# 
# sigma^2 estimated as 0.3996: log likelihood=-99.8 
# AIC=217.6 AICc=219.44 BIC=241.74 
여기

auto.arima 자동 AIC = 219.96ARIMA(0,0,1)보다 더 나은입니다 AIC 값을 기준으로 최고의 ARIMA(4,0,2) 모델을 선택합니다. 이 Q-Q 플롯 같이 착용감도 좋다 - 자동 박스라는 R에 다른 패키지가있다

Q-Q plot for ARIMA(4,0,2)

+0

감사합니다. 하지만이 모델 설정을 사용해야합니다. 모델 뒤에는 경제적 의미가 있습니다. –

+0

모델의 변수는 통계적으로 중요하지 않으며 잔차를 그릴 때 오차는 일정하지 않은 편차를 갖습니다 –

0

. autobox.com에서 구할 수 있습니다.

표준화

플롯은 X가 Normalized Bivariated Scatterplot

차이점과 모델 변수 x 3 특이점 Y로 관련되어 있음을 보여준다. .257 계수는 훨씬 낮습니다. 분산의 변화를 테스트하고 가중 최소 제곱을 사용하여

Model with differencing

는 (GLM) 우리는 종이 here을 참조 기간 (44)에서 시작하는 분산의 변화를 확인했다.

Tsay variance test

잔차 Residuals