계속 내가 가지고 다음과 같은 데이터 세트비닝 기술 데이터
열 1 6
1.0000 0 0.9954 -0.0589 0.8524 0.0231
1.0000 0 1.0000 -0.1883 0.9304 -0.3616
1.0000 0 1.0000 -0.0336 1.0000 0.0049
1.0000 0 1.0000 -0.4516 1.0000 1.0000
1.0000 0 1.0000 -0.0240 0.9414 0.0653
1.0000 0 0.0234 -0.0059 -0.0992 -0.1195
1.0000 0 0.9759 -0.1060 0.9460 -0.2080
0 0 0 0 0 0
1.0000 0 0.9636 -0.0720 1.0000 -0.1433
을 통해 나는 문제 중 하나는 데이터가 이진 분할을 계속 사용하여 의사 결정 트리 구축을 위해 노력하고 있는데 현재의 구현은 데이터를 그대로두고 분할을 수행하여 계산적으로 강렬 해집니다. 나는 당신이 단지 하나의 분류자를 만드는 경우에 그렇게 나쁠 것이라고 말할 것입니다.
제 경우에는 10 배를하고 5 분에서 50 분까지 분류자를 늘립니다 (Bagging). 나는 데이터가 양동이를 0.2 버킷으로 얻는 방식으로 binning을 할 생각 이었지만 음수가 있다는 것을 깨달았다. 나는 구현을 위해 matlab을 사용하고있다. 저는 Matlab NewB입니다. 이와 같은 시나리오를 처리하기위한 사전 정의 방법이 있는지 확실하지 않습니다. 이 완전히 질문을 해결하지만 문제는 '버킷'을 정의하는 경우 동적으로이 작업을 수행 할 수 있는지 여부를
좀 더 명확하게 문제를 작성해주십시오. 당신이이 질문을 많이 향상시킬 수있는 간단하고 짧은 문장을 고수한다면. 나는 대답하기 전에이 문제의 언어를 정리하려했지만 이해할 수없는 것들이있었습니다. 건배. –