2017-09-29 1 views
1

Sklearn DecisionTreeClassifier를 사용하고 있으며 자신의 기준 함수 (기본적으로 gini 또는 엔트로피를 사용할 수 있지만 원하는 것은 아닙니다)를 만들고 싶습니다. 다음과 같은 것 :의사 결정 트리에 대한 내 자신의 기준 함수 만들기

clf = DecisionTreeClassifier(criterion = 'my_function') 

그렇게 할 수 있습니까?

비슷한 알고리즘이 있나요 (Python 또는 R)?

감사합니다.

답변

1

R의 경우 rpart package을 사용할 수 있습니다. 특히 User Written Split Functions 비 네트를 참조하십시오. 의사 결정 트리 경험이 제한되어 있음에도 불구하고 예제를 따라 사용자 정의 알고리즘을 사용하여 다 변수 출력을 처리 할 수있었습니다.

그러나 내장 분류 프로그램은 빠른 외부 라이브러리를 사용하므로 알고리즘을 일반 R로 작성하면 처리 속도가 상당히 느려질 수 있습니다. 비 네트 노트에 따르면 교차 검증은 예상되는 속도 저하로 인해 기본적으로 비활성화되어 있습니다. 데이터가 "작다"(또는 조금 더 기다릴 수도 있음) 경우 문제가되지 않을 수도 있습니다.