저는 데이터 마이닝 초보자이며 고차원 데이터 세트 (하위 세트는 아래에 표시)에 대한 도움이 필요합니다. 실제로 30 차원과 수천 행이 있습니다.다차원 데이터 클러스터링
작업은 클러스터링 방법과이 데이터에서 유사성 메트릭을 계산할 수 있는지 확인하는 것입니다. 나는 SOM과 코사인 유사성 접근법을 보았지만이 문제에 접근하는 방법을 모르고있다.
p.s. R이나 비슷한 통계 패키지에 익숙하지 않아서 C#/.NET 기반 라이브러리의 일부 포인터에 감사 할 것입니다.
"ROW" "CPG" "FSD" "FR" "CV" "BI22" "MI99" "ME" "HC" "L1" "L2" "TL"
1 298 840 3.80 5.16 169.17 69 25.0 0.82 125 453 792
2 863 676 4.09 4.28 97.22 63 18.5 0.85 172 448 571
3 915 942 7.04 5.33 33.01 72 35.1 0.86 134 450 574
고맙습니다. – Mikos