2014-12-31 5 views
1

R의 이항 로지스틱 회귀에서 예상 확률에 대한 신뢰 구간을 결정하려고합니다.이 모델은 rms에서 lrm을 사용하여 추정되어 측량시 클러스터링 표준 오류를 허용합니다 (각 응답자는 데이터에 3 회까지 나타납니다) 응답자 :predict.lrm에서 예측 된 확률에 대한 신뢰 간격

library(rms) 
model1<-lrm(outcome~var1+var2+var3,data=mydata,x=T,y=T,se.fit=T) 
model.rob<-robcov(model1,cluster=respondent.id) 

나는 결과가 predict.lrm 사용에 대한 예측 가능성을 추정 할 수 있어요 :

predicted.prob<-predict(model.rob,newdata=data.frame(var1=1,var2=.33,var3=.5), 
type="fitted") 

내가 결정하고자하는 것은이 예측 확률에 대한 95 % 신뢰 구간입니다. se.fit=T을 지정하려고 시도했지만 predict.lrm에 허용되지 않는 경우 type=fitted입니다.

lrm (분명히)과 함께 이것을하는 방법에 대해 인터넷을 수색하는데 지난 몇 시간을 보냈습니다. 아무도이 신뢰 구간을 결정하는 방법으로 나를 가리킬 수 있습니까? 또는 lrm 모델로 불가능하거나 어려울 경우 신뢰 구간을보다 쉽게 ​​얻을 수있는 클러스터 된 표준 오차를 갖는 로짓을 예측하는 다른 방법이 있습니까?

+0

다른 SE 사이트에서 더 적절하게 마감하십시오. 데이터 예제가 없다면 이는 통계적인 질문 일뿐입니다. 게다가 Frank는 CrossValidated.com에서 그가 여기있는 것보다 더 많이 볼 가능성이 높습니다. –

+0

이 유형의 질문에 더 적합한 사이트가 어떤 것인지 명확하지 않습니다. 질문은 프로그래밍에 관한 것이지만 stat에 대해서는 분명히 다루고 있습니다. –

+0

@FrankHarrell 나는'exp (fit +/- 1.96 * se)/(1+ exp (fit +/- 1.96 * se)) '전략을 제안했지만'? predict.lrm'을보고 나서 당신이 그걸 제공하지 않은 이유. 아마도 공분산을 고려하지 않은 문제가 있다고 생각했습니다. 보시다시피, 나는 예제를 통해 내려 가지 않았다. 그리고 만약 내가 여기 앉아 있으면 곧 못 본다고 생각합니다. –

답변

2

predict.lrm에 대한 도움말 파일에는 명확한 예가 있습니다.

L <- predict(fit, newdata=data.frame(...), se.fit=TRUE) 
plogis(with(L, linear.predictors + 1.96*cbind(- se.fit, se.fit))) 

당신은, 예를 gendata 또는 Predict 기능을 사용할 수있는 몇 가지 문제 : 여기에 약간의 수정이다

L <- predict(fit, gendata(fit, var1=1), se.fit=TRUE) # leave other vars at median/mode 
Predict(fit, var1=1:2, var2=3) # leave other vars at median/mode; gives CLs 
+0

도움을 주셔서 감사합니다 - 매력처럼 작동합니다. 나는 하나의 후속 질문을 가지고있다 : 비슷한 전략이 순서화 된 회귀 회귀로부터 예측 된 확률에 대한 신뢰 구간을 결정하는데 사용될 수 있는가? (즉, 바닥 2에 반대되는 척도의 상위 2 개 범주 중 하나에 착륙 할 확률) ? – Corn

+0

예. 'Predict'의'kint' 인수를보십시오. –