-1
나는 가중치를 할당하여 클러스터링해야하는 Excel 시트에 데이터 세트가 있습니다. 내가 어떻게 해?속성에 가중치를 할당하여 클러스터링
나는 가중치를 할당하여 클러스터링해야하는 Excel 시트에 데이터 세트가 있습니다. 내가 어떻게 해?속성에 가중치를 할당하여 클러스터링
속성 가중치를 기준으로 두 점 사이의 거리를 계산하는 함수를 정의 할 수 있습니다. 이 예제는 가중 유클리드 거리가됩니다
특히 데이터 세트의 각 포인트에 대해 k 개의 속성이 있고 속성의 해당 가중치가 d1, d2, .., dk이면 두 점 X와 Y 사이의 거리
D (X, Y) = 합 (디 * (사이 - 일)^2) I = 1,2..k 사이는 제 i의 값이 점 X.
경우에 대한 특성이다 가중치는 마하 라 노비스 거리까지 감소하는 속성의 분산의 역수입니다.
http://en.wikipedia.org/wiki/Mahalanobis_distance
거리 함수를 정의하면 K- 평균을 사용하여 데이터를 클러스터링 할 수 있습니다.