나는 총 95 개의 잠재적 인 예측 변수를 가지고 있는데, 그 수를 더 많은 예측 능력을 가진 변수로 줄이고 싶습니다. 지금까지의 계획은 루프 내에서 6 개의 랜덤 예측 변수를 선택하고 단계적 회귀 (방향 = 둘 다)를 수행하여 코드를 작성하는 것이 었습니다 :루프 된 단계별 회귀에서 테이블에 쓰는 데 문제가 있습니다.
- 이 루프는 모든 가능한 조합을 입력 할 수 있도록 100,000 반복됩니다.
- (요약 명령의) 예측 자의 중요성은 p 값을 기반으로합니다. 중요한 값 < 0.05가 '1'로 코드화되고> 0.05 인 경우 6 개의 예측 변수 (또는 그 이하)에 대해 '0'이되는 경우. 예측기 이름은 루프 출력 테이블에 보존됩니다.
나는 하나의 출력 테이블을 95 개의 열로 만들고 루프의 각 반복마다 생성 된 6 개의 열을 사용하여 각 개별 줄에 쓸 수 없습니다. 열 이름
results <- array(NA,c(100000,95))
에 의해 할당 :
그래서 만든 배열에 추가 할 수있는 방법이 대신 무작위로 변수를 선택의
colnames(results)<-c(<inputdata>)
나는이 종류 o fthing가 어떻게 일하는지 실제로 모르지만, 선택 (95,6)를위한 100,000의 조합 이상있다. 무작위 표본을 100,000 회 이상 가져 오는 것보다 변수를 결합하는 것이 더 똑똑해야합니다. –
패키지'MASS'는 여러분도 관심을 가질만한'stepAIC' 함수를 가지고 있습니다 : http://www.statmethods.net/stats/regression.html. 아래쪽으로 내려가는 예제가 있습니다 ... – Chase
당신이하고있는 일을 알 수 있습니다 - 당신이 제안하는 것은 표준적인 (순진한) 단계별 접근법보다 조금 더 복잡 합니다만, 당신을 상기시킬 수는 없습니다. 단계적으로 접근 할 때 ** 매우주의해야합니다 ** - 종종 예측 능력이 매우 떨어집니다. 여러 가지 조합에 대한 평균을 취하면 단계별 접근법의 임의성/경로 의존성을 처리하지만 지나치게 추측 할 수있는 근본적인 경향은 아닙니다 (http://www.stata.com/support/faqs/stat/stepwise). .html –