2012-12-26 2 views

답변

1

실제 데이터 세트가 많은 특성을 포함 할 수 있습니다 이유는 확실하지 메신저 것으로 보인다 내 데이터 세트에 적용 할 때 새로운 메신저

을 WEKA로서 누군가가 간단한 언어로 말해주십시오 수 있습니다. 이 데이터 세트에 데이터 마이닝 프로세스를 적용하면 (예 : 클러스터 찾기, 분류 모델 생성 ...) 매우 오랜 시간이 걸릴 수 있습니다.

대신에 the most discriminative attributes이라는 몇 가지 속성 (크기)을 선택할 수 있습니다. 이러한 속성은 더 적은 수의 속성으로 데이터 세트를 거의 설명 할 수 있으며, 이는 데이터에서 수행 된 모든 프로세스의 속도를 높입니다.

속성 선택 탭에는 이러한 속성을 선택하는 여러 가지 방법이 있습니다. 그 중 하나는 CFS Feature Set Evaluation입니다.이 필터는 차별 속성을 만드는 클래스 레이블과 더 높은 상관 관계를 갖는 속성을 제공합니다.