저는 목표 변수로 이익을 내고 약 100 개의 다른 예측 변수 (일부 바이너리, 일부 연속 및 일부 문자)가있는 데이터 세트를 가지고 있습니다.의사 결정 트리를 사용하여 이익과 같은 연속 변수를 극대화하십시오.
이익이 최대가되는 (그리고 선호되는 것은> 0) 버킷 (또는 엔드 노드)을 줄 수있는 R에 의사 결정 트리 패키지가 있습니까?
현재 저는 partykit 패키지의 ctree를 사용하고 있습니다. 분할 된 나무는 항상 예측 변수를 잘 분할하지만 최종 노드는 언제나 부정적인 이익을 가져옵니다.
또한 노드 끝에서 결과를 이해하는 데 어려움이 있습니다. 이들은 'N ='및 '오류 ='경향이 있습니다. 대신 '이익 ='을 얻을 수있는 방법이 있습니까? 그래서 가장 좋은 최종 노드가 무엇인지 확인할 수 있습니까?
많은 감사, 첫째
이상적으로 말하자면, 5 가지 속성의 특정 변수가 나뉘어 질 때 시나리오를 원합니다. 의사 결정 트리는 각 순열에서 수익을 합산하고 합계 이익의 차이가 가장 큰 두 개의 양동이로 변수를 나눕니다. 이 작업을 수행하는 함수가 있습니까? – Tammboy
그런 다음 각 변수를 반복하여 가장 큰 이익 차별화 변수를 찾습니다. 그러면 노드 1이됩니다 ... – Tammboy
신뢰할 수있는 대답을 위해보다 정확하게 공식화해야합니다. 표준 회귀 나무가 당신이하고 싶은 것과 아주 가깝습니다. 그러나 그것은 매우 다른 것일 수도 있습니다. 지금은 확실하지 않습니다. –