2016-09-22 6 views
1

나는 rf 방법으로 데이터 세트를 훈련 시켰습니다. 예를 들어 : thath 후R (Caret)의 의사 결정 트리

ctrl <- trainControl(
        method = "LGOCV", 
        repeats = 3, 
        savePred=TRUE, 
        verboseIter = TRUE, 
        preProcOptions = list(thresh = 0.95) 
        ) 

preProcessInTrain<-c("center", "scale") 
metric_used<-"Accuracy" 
model <- train(
       Output ~ ., data = training, 
       method = "rf", 
       trControl = ctrl, 
       metric=metric_used, 
       tuneLength = 10, 
       preProc = preProcessInTrain 
      ) 

, 나는 decission 트리 음모 싶지만 plot(model)을 wirte 때,이 얻을 : plot(model)합니다.

내가 plot(model$finalModel)을 작성하는 경우, 나는이 얻을 : plot(model$finalModel)

나는 decission 트리를 플롯 싶습니다

...

내가 어떻게 할 수 있습니까? 고마워요 :)

답변

2

사용중인 모델은 단일 결정 트리가 아닌 많은 수의 나무의 앙상블 인 임의의 포리스트입니다. 최종 모델을 그리면 다음과 같이 나무 수가 증가함에 따라 교육 및 테스트 데이터 세트의 오류율이 표시됩니다.

enter image description here

대신 하나의 의사 결정 트리를 원한다면, 당신은 다음과 같은 쇼핑 카트에 담기 모델 훈련하실 수 있습니다 :

model <- train(
    Species ~ ., data = training, 
    method = "rpart", 
    trControl = ctrl, 
    metric=metric_used, 
    tuneLength = 10, 
    preProc = preProcessInTrain 
) 
library(rpart.plot) 
rpart.plot(model$finalModel) 

지금의 의사 결정 트리를 그릴 것입니다 위와 같이 최종 모델을 세우고을 당신.

+1

감사합니다. 질문이 하나 있습니다. 파란색, 녹색, 검은 색 및 빨간색 선은 무엇을 의미합니까? 내말은, 그들 사이의 차이점은 무엇입니까? –

+1

질문 주셔서 감사합니다. 검정색 선은 전체 OOB 오류를 나타내지 만 다른 세 개의 색칠 된 선은 교육 데이터의 3 가지 클래스 각각에 대한 OOB 오류를 나타냅니다 (나는 3 개의 다른 클래스 레이블로 교육 데이터를 사용함). –

관련 문제