2016-07-07 7 views
0

누락 된 데이터가있는 SAS 데이터 세트가 여러 열에 있습니다. 누락 된 데이터를 데이터 세트의 다른 데이터를 기반으로 한 예측으로 바꾸고 싶습니다. Here 방법을 설명하는 링크가 있지만 방법을 보여주지 않습니다. 누락 된 값을 예측으로 대체하려면 어떻게합니까?SAS에서 누락 된 데이터를 예측으로 바꿉니다. 회귀 대체

편집 : 내가 염두에두고 있던 방법은 Proc Reg를 사용하여 누락 된 데이터에 coefficents를 적용하여 추정치를 생성하는 것이 었습니다. 이 질문에 대한 대답이 있습니까?

+0

지금은 너무 광범위합니다. 다른 사람들 사이의 설명에 따르면이 작업을 수행하는 방법이 너무 많습니다. 예측하는 당신의 방법은 무엇입니까? – Joe

답변

1

PROC STDIZE, PROC EXPANDPROC MI은 모두 '예측'을 정확히 원하는 방식에 따라 데이터에 대해 여러 가지 유형의 대체물을 수행 할 수 있습니다.

평균값으로 바꾸는 것과 같은 단순한 작업의 경우, PROC STDIZE이 좋습니다. PROC MI이 가장 앞선 것입니다. 다중 대체를 수행합니다. PROC EXPAND은 시계열 데이터를 가지고있는 경우에 적합합니다. 시계열 데이터에서 올바른 값이 시계열의 해당 점에 맞는지 확인하려고하기 때문에 적절합니다.

1

여러 열에 누락 된 데이터가있는 경우 여러 회귀가 필요합니다. 이것은 아마도 좋은 방법은 아니지만 질문에 대답하는 것입니다. 요청하는 것은 데이터 집합 채점이라고하며 PROC SCORE을 사용할 수 있습니다.

대체 방법으로 회귀 절차에서 회귀에 대한 예측 값이 포함 된 OUTPUT 데이터 집합을 요청합니다. 방법론의 문제로

output out=predicted1 p=pred_var_missing; 

, 내가 대신 조의 방법 @ 좋습니다.

0

@ Joe의 답변에 덧붙여 귀하가 왜이 대체 작업을 원하는지 알려 주시면 더 나은 조언을 제공 할 수 있습니다. 나는 도움이 될 수있는 How to Ask a Statistics Question이라는 블로그 게시물을 썼다.

그러나 종종 단일 대체는 나쁜 방법입니다. 특히,이 데이터 (귀속 된 값들)에 대한 추가 분석을 수행하려는 경우, 단일 대체는 데이터의 가변성을 과소 평가하고 잘못된 결과를 제공합니다.

일반적으로 PROC MI가 더 나은 방법입니다.

관련 문제