2013-04-16 1 views
4
나는이 분할 < 21.51의 BMI 값을 기준으로 우측 자식 노드에 케이스를 보내 주 변수와 비슷한 분할을 가지고 이해
Surrogate splits: 
    ##  bmi < 21.51 to the right, agree=0.858, adj=0.632, (0 split) 

(= 0.858 동의) 및 노드 불순물의 적절한 감소 (adj = 0.632).해석 R 출력 Rpart 분류 트리 대리 분할

출력의 (0 분할) 부분을 이해하지 못합니까? 또한 계약의 값이 1 인 경우 의심스러운 것입니까?

감사합니다.

답변

4

첫 번째 기본 스플릿에 예를 들어 10 개가없는 경우 rpart는 대리 스플릿을 사용하여 항목을 분류하려고합니다. 이들 중 9 개가 첫 번째 대리 변수에서 누락되지 않은 경우 rpart는이 변수를 사용하며 변수가 9 개의 분할로 사용되었으므로이 대리 변수 옆에 rpart 출력에 (9 개 분기)을 갖습니다.

데이터가 대리 변수에 누락 된 경우 (0 스플릿)가 출력됩니다.

내가 계약의 정확한 계산을 모르지만 당신이 1의 계약을 체결 한 것이라면 내가 생각하는 주요 변수를 사용할 때와 같은 분류의 대리 변수 결과. 대리 변수가 예를 들어 단조 변형 된 기본 변수 버전 인 경우 이런 일이 발생할 수 있습니다.