2012-07-23 4 views
0

데이터 마이닝을 처리하는 동안 문제가 발생했습니다.오라클의 의사 결정 트리 알고리즘의 이진으로 변환

이제 테이블이있는 그림을 첨부했습니다. 이 테이블에는 고유 한 subscriber_id 열이 있으며이 프로젝트에 의사 결정 트리 알고리즘을 사용해야합니다. 의사 결정 트리 알고리즘은 이진수 만 허용하며이 수를 이진수로 변환하는 방법을 알지 못합니다. 당신의 "진수"요구 사항이 구체적으로 기술적으로하지만, 하나 개의 솔루션은 바이너리 표현으로 문자열에서 각 문자를 변환하는 것입니다 무엇을

http://ehmad11.com/DM1.png

답변

1

의사 결정 나무해야 비 - 바이너리 속성에서도 작동합니다. 오라클이이를 지원하지 않는다면 더 나은 도구를 사용하십시오.

하지만 구독자 ID 열은 사용하지 마십시오. ID는 사용자에게 고유 한 것으로 예측하기에는 완벽하지만 실제로는 쓸모가 없습니다.

1

확실하지 :

SELECT 
     REPLACE(
     REPLACE(
     REPLACE(
      REPLACE(
      REPLACE(
      REPLACE(
      REPLACE(
       REPLACE(
       REPLACE(
       REPLACE(
       REPLACE(
        REPLACE(TRANSLATE ('1.233.234.234-12312312' -- example from you screenshot, subscriber_id goes here 
            , '.-'      -- non-numeric characters in your data, extend if more possible 
            , 'AB')     -- replacement for non-numeric characters in your data, extend if more possible 
        ,'0','0000') 
       ,'1','0001') 
       ,'2','0010') 
       ,'3','0011') 
       ,'4','0100') 
      ,'5','0101') 
      ,'6','0110') 
      ,'7','0111') 
      ,'8','1000') 
     ,'9','1001') 
     ,'A','1010') 
     ,'B','1011') -- extend to C, D, ... if more non-numerics in your data 
     AS bin 
    FROM dual 
; 
0

결정 트리는 2 진이 아닌 속성을 허용해야합니다.

당신의 도구가 이것을 지원하지 않는 것이 이상하게 보입니다. 나는 더 나은 도구를 찾을 것을 제안합니다.

관련 문제