2013-07-02 2 views
1

coxph 모델을 100 데이터 포인트로 피팅하는 것을 고려하십시오. 분석에는 95 개가 포함되지만 NA (누락)으로 인해 5 개가 제외됩니다. 나는 95 개의 관측 값을 가진 잔차 벡터를 가지기 위해 적합한 데이터에 대한 나머지를 추출한다. 잔차를 원본 데이터 프레임에 다시 포함시키고 싶습니다만, 길이가 다르기 때문에 이것을 할 수 없습니다.적합 모델에서 누락 된 위치 찾기 R

원본 데이터 프레임의 어떤 관측치가 모델에 포함되어 있지 않은지 어떻게 식별 할 수 있습니까? 따라서 두 길이를 동일하게 만들기 위해 제외하거나 삭제할 수 있습니까?

+0

'na.omit'일지 모르지만 정확히 무엇을하고 있는지 확신 할 수 없습니다. 일반적으로 [최소 작업 예제]를 제공합니다 (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example). –

+0

나는 특정 열에 대한 누락 된 값이있는 행을 찾으려면 어떻게 해야할지 알고 싶지만 coxph 메서드가 무언가를 '누락'으로 분류하는 것을 모르는 경우 – user2543095

+1

5 개의 값을 직접 제외 했습니까, 아니면 일부 동작 이었습니까? coxph 님이 촬영 한 것을? 전자의 경우, 제외 된 (또는 포함 된) 값의 색인이 무엇인지 알고 있으므로 관찰을 해당 색인 집합에 매핑하십시오. –

답변

3

na.excludena.action 인수를 설정, 모델을 다시 맞게 (원래 데이터는 ... 그것은 데이터가없는 곳의 위치를 ​​하드, 그래서 훨씬 더 크다). 이 값은 NA s 인 채워진 객체의 일부인 잔차 및 맞춤 값을 채 웁니다. 원래 모델 zn50 경우 :

zn50_na <- update(zn50, na.action=na.exclude) 

이렇게하면 residuals(zn50_na)하고 적절한 길이의 fitted(zn50_na)를 제공해야합니다. 자세한 내용은 ?na.omit을 참조하십시오.

+0

시도했습니다. 누락 된 값도 마찬가지이므로 누락 률을 계산하는 coxph -> bmi = 8165, smoke = 12862, dod = 299067 – user2543095