2010-12-29 11 views
2

값이 누락 된 로지스틱 회귀 분석을 사용할 수 있습니까?로지스틱 회귀 누락 값

많은 continuos 속성과 일부 범주가 있는데 사용자 누락으로 설정할 수 있습니까? 유용할까요?

+0

스택 오버플로를 환영하고 우리가 일반적으로 여기에서하는 세 가지 점을 기억하도록하십시오 : 1) 도움을 받으면 전문 지식 영역에서 ** 답변하는 질문 **을하십시오. ** 읽기 FAQ ** 3) 좋은 질문과 답변을 볼 때 시스템의 신뢰성은 사용자가 지식을 공유함으로써 얻을 수있는 명성을 기반으로하기 때문에 ** 회색 삼각형 **을 사용하여 상향 표시하십시오. 또한 체크 표시 (**)를 눌러 문제를 해결할 수있는 답을 수락하는 것을 기억하십시오 ** http://i.imgur.com/uqJeW.png –

답변

0

회귀 분석을 수행하려면 각 이벤트에 대해 측정 된 모든 변수가 필요합니다. 아마도 다른 기술은 누락 된 속성과 함께 작동하지만 회귀는 작동하지 않습니다.

BTW, 당신은 https://stats.stackexchange.com/

HTH의 질문을 게시 시도해야합니다!

0

대부분의 회귀 절차에는 완전한 데이터가 필요하지만 누락 된 값을 처리하는 다양한 방법이 있습니다. 이것은 미묘한 주제이므로 여기서 완전한 대답을하는 척하지 않고 주제에 대한 독서를하는 것이 좋습니다. 간단히 생각해 보면 :

  1. 이 문제를 해결하기 위해 관측치를 삭제하지 마십시오.
  2. 변수 삭제는 항상 허용되지만 분명히 데이터 예산면에서 상당히 심각합니다.
  3. non-missings의 평균 또는 중간 값과 같은 글로벌 상수 값이 누락 된 경우 (누락 비율이 매우 낮은 경우) 아껴서 수행해야합니다.
  4. 위의 3 번보다 다른 독립 변수를 기반으로 선택한 값으로 누락 값을 채우는 것이 좋습니다.

이 주제에 대해 자세히 알아 보려면 "imputation", 특히 "단일 대체"및 "다중 대체", "무작위로 누락 됨"및 "완전히 무작위로 누락"이라는 용어에 대한 정보를 찾으십시오.