결과 변수 Y와 Y에 영향을 줄 수있는 20 개의 변수 목록 (예 : X1 ... X20)이 있습니다. 어떤 변수가 Y와 독립적이지 않은지 테스트하고 싶습니다. 이렇게하려면 각 변수와 Y (예 : Y ~ X1, ..., Y ~ X20)에 대해 단일 변수 glm을 실행하고 다음에 대한 우도 비 테스트를 수행하고 싶습니다. 각 모델. 마지막으로 각 모델에 대한 우도 테스트의 결과 P 값을 갖는 테이블을 만들고 싶습니다.여러 변수를 사용하여 단일 변수 GLM 반복
lapply 함수와 split 함수를 사용하면 유용 할 수 있지만 실제로 본 예제에서 어떻게 작동하는지 이해하지 못합니다.
이것은 내가 처음에 뭘하려 : 좋은 방법은 생각이라면
> VarNames<-c(names(data[30:47]))
> glms<-glm(intBT~VarNames,family=binomial(logit))
Error in model.frame.default(formula = intBT ~ VarNames, drop.unused.levels = TRUE) :
variable lengths differ (found for 'VarNames')
잘 모르겠어요.
당신은 접근이 통계적으로 소리가되어 있는지 있습니까? 20 개의 모델을 만드는 것은 나에게 나쁜 생각처럼 보입니다. 아마도 CrossValidated가 물어볼 적절한 곳입니다. – nico
@nico Applied Logistic Regression (Hosmer and Lemeshow, 2000)에서 권장하는 변수 선택 방법을 따르고 있습니다. 내 응답 변수가 이진 로지스틱 회귀이기 때문에 변수가 응답과 중요한 관계가 있는지 여부를 평가하는 가장 좋은 방법입니다. – see24
OK, 내 코멘트를 잊어 버려. :) – nico