최종 단계 모델 구축을 자동화하려고했습니다. 두 개의 서로 다른 모델의 예측 변수를 하나의 최종 모델로 결합하고 싶습니다. update.formula()
으로 놀았지만 이전 lmfit $ 통화를 새 것으로 업데이트 할 수 있음을 깨달았습니다 (예 : update.formula(lmfit$call,lmfitnew$call)
). 여기에 내가 두 모델에서 벚꽃 선택 변수에 필요하고 이것은 내가 내 최종 모델에서하고 싶은 것입니다 어떻게 두 개의 다른 선형 모델의 예측 변수를 하나로 결합 할 수 있습니까?
lmfit1 <- lm(y~ x1+x2+x3, data = modelready)
best.ngc_fit <- stepAIC(lmfit1, direction="backward")
best.ngc_fit$call
lm(formula = y~ x2+x3, data = modelready)
lmfit2 <- lm(y ~ a+b+c+d+f, data=fcstmodel)
best.fcst_fit <- stepAIC(lmfit2, direction ="backward")
best.fcst_fit$call
lm(formula = y~ a+c+d+f, data = fcstmodel)
한 최종
실행
best.full_fit <- lm(y~x2+x3+a+c+d+f, data = fullmodel)
내가 수동으로 문제없이 그것을 할 수
, 그러나 나는 전체 과정을 덜 지루하게하기 위해 그것을 자동화하고 싶다. 이것은 각 모델의 구성 요소를 추출하고 새로운 디자인 매트릭스로 결합의 문제의 경우
어떤 도움이 많이
왜 데이터를 병합하고 전체 론적 모델을 먼저 만들어보십시오. x1, x2, x3 = 0으로 설정하면 a, b, c, d, f> 0이고 그 반대가됩니다. 즉, 변수 x가 적절하게 채워지는 x1, x2, x3, x4, a, b, c, d, f 열을 포함하는 data.frame을 사용 하시겠습니까? –
Brandon, 귀하의 의견에 감사드립니다.이 모델은 원래 SAS로 작성되었습니다. 모델 구성 방식은 두 가지 최상의 모델을 결합하는 것입니다. 최우선 모델의 예측 변수는 거시 경제 변수와 관련된 물가 지수 (주택 가격 지수), 차선 모델의 예측 변수는 실업률 등과 같은 노동 지수와 관련이있다. 모델로의 데이터 흐름의 기본 구조를 변경할 자유가 없습니다. 그렇게한다면 나는 이것을 고위 경영진에게 팔 수 없다. 나는 미국에서 선도적 인 은행을 위해 일하고 있으며, 우리가하는 것들은 우리에게 의미가 없기 때문에 대중에게 그렇게합니다. – Anand