2013-02-23 4 views
3

저는 프로젝트에서 일하고 있는데 R에 가져온 데이터 세트를 기반으로 의사 결정 트리를 만들 수 있어야합니다. rpart 패키지를 사용하면되고 싶습니다. 하나는 gini 분할 기준을 사용하고 다른 하나는 엔트로피 분할 기준을 사용하여 한 쌍의 의사 결정 트리를 생성 할 수 있습니다. 가능한 경우 최대 트리 깊이를 조정할 수 있기를 바랍니다. 아무도 이것을하는 방법을 아는가? 어떤 도움을 주시면 감사하겠습니다!rpart와 함께 R의 의사 결정 트리를 그려야합니다.

+0

재현 가능한 데이터 세트를 첨부하여 다른 사람들이 참고 자료로 사용할 수 있다면 좋을 것입니다. http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example을 통한 안내 – Jochem

답변

7

는 R 매뉴얼 here 따르면, rpart()는 파라미터를 사용하여 지니 또는 정보 (즉 엔트로피) 분할을 사용하도록 설정 될 수

parms = list(split = "gini")) 

또는

parms = list(split = "information")) 

... 각각.

또한 기본 30되는 maxdepth 포함 (here 참조) rpart.control에 대한 매개 변수를 추가 할 수 있습니다.

관련 문제