2013-04-05 6 views
0

각 열이 특정 변수 인 Excel 스프레드 시트가 있습니다. 내 칼럼의 마지막 부분에는 A, B, C 또는 D가 될 수있는 "Type"이라는 특별한 마지막 열이 있습니다.Microsoft Excel 2003의 상관 관계/데이터 마이닝

각 행은 특정 "유형" 양동이 (A/B/C/D)는 마지막 열에 기록됩니다.

특정 유형 (예 : "C"또는 "C"| "D")의 모든 항목을 검사하고이 변수 중 어느 것이이 마지막 열의 좋은 예측 자인지 알아야합니다. 다른 사람들보다 더 나은 예측 인자입니다.

일부 변수는 숫자이고 다른 변수는 고정 된 문자열 (문자열 세트)이므로 숫자/숫자 상관 관계가 아닙니다.

Excel 2003은이를위한 유용한 도구입니까, 아니면 더 쉽게 사용할 수있는 통계 프로그램입니까? 각 범주에 대해 Pivot/Histogram을 만들거나 이러한 쿼리를 실행하는 더 좋은 방법이 있습니까? 감사합니다

답변

0

microsoft excel을 사용하여 데이터를 정리 (특히 데이터 유형을 하나의 유형, 문자열 또는 숫자로 변경) 할 수 있습니다. 또한 Execl은 일부 데이터 마이닝을 수행합니다. 그러나, 당신이 가지고있는 문제의 종류를 위해, 내가 추천하는 좋은 도구는 WEKA입니다. 이 도구를 사용하면 모든 데이터 인스턴스 (행)의 연관성 분류 예측 (즉, 클래스 연결 규칙 마이닝)을 수행 할 수 있으므로 A/B/C/D에 속하는 항목을 결정할 수 있습니다. 특수 속성이 클래스 속성이됩니다.