로지스틱 회귀 분석을 실행하고 계속 "NA"오류가 발생합니다. 문제는없는 NA NA가이 말하는 열 자사의 모든 0 또는 1. 다음 내 코드가 같이 나는 또한 LM()을 시도하고 여전히 오류가있어로지스틱 회귀 없음 오류
#V1=race, V2=momcounts of breast cancer, V3=prstatus, V4=erstatus, V5=her2status, V6=triplenegative, V7=menopause, V8=agemenopause, V9=mentype, V10=mensurg, V11=bmi, V12=eversmok, V13=age, V14=breastfeed, V15=breastfeedmonths, V16=pregnum, V17=birthcount, V18=agefirstpreg,
regressiondata <- as.data.frame(cbind((data[,'race']),(data[,'mom_countsofbreastcancer']),(data[,'prstatus']),(data[,'erstatus']),(data[,'her2status']),(data[,'triplenegative']),(data[,'menopause']),(data[,'agemenopause']),(data[,'mentype']),(data[,'mensurg']),(data[,'bmi']),(data[,'eversmok']),(data[,'age']),(data[,'breastfeed']),(data[,'breastfeedmonths']),(data[,'pregnum']),(data[,'birthcount']),(data[,'agefirstpreg'])), stringsAsFactors=F)
dataAA=regressiondata[regressiondata$V1==2,] #AA
glm(V6 ~ V2+V7+V8+V10+V11+V12+V13+V14+V15+V16+V17+V18, family=binomial, data=dataAA)
:
를lm(formula=V6~V2+V7+V8+V10, data=dataAA)
오류는 : R은 자동으로 제외 있도록 V17는, 모델의 다른 변수의 선형 조합처럼
Coefficients:
(Intercept) V2 V7 V8 V10 V11
1326.433 -17.262 NA -31.174 -34.108 0.525
V12 V13 V14 V15 V16 V17
2.281 11.060 NA 1.154 -50.258 NA
V18
-12.277
Degrees of Freedom: 12 Total (i.e. Null); 3 Residual
(1474 observations deleted due to missingness)
Null Deviance: 16.05
Residual Deviance: 3.49e-10 AIC: 20
Warning message:
glm.fit: fitted probabilities numerically 0 or 1 occurred
이것은 데이터 관련 질문이므로 일부 데이터를 포함하여 재현 가능한 예제 없이는 명확하게 대답 할 수 없습니다. – mnel
'glm.fit : 확률이 수치상으로 0 또는 1 발생 '- 모델이 지나치게 보인다. 즉, 예측 자의 일부 조합이 결과의 완벽한 분류를 허용한다. 이것은 계수가 아주 조심스럽게 해석되어야 함을 의미합니다. 이것은 큰 번호의 결과 일 수 있습니다. 관측을 제외했다. 일반적으로 모델의 각 계수에 대해> 10 관측치가 필요합니다. – dardisco
당신이 여기에 새로 왔기 때문에 [** the about **] (http://stackoverflow.com/about)와 [** faq **] (http://stackoverflow.com/faq) SO가 어떻게 작동하는지. StackOverflow는 ** 당신의 문제를 해결하는 대답을받을 때 당신에게 유용한 작은 체크 마크 및/또는 upvote 대답을 클릭하면 받아 들일 수 있습니다. 당신은 절대적으로 그렇게 할 의무가 없습니다 **하지만 대답이 사실상 당신의 문제를 해결했다면 사이트에 "되돌려주는"좋은 방법입니다. –