2017-01-24 2 views
0

내가 클러스터 평가에서 SSB 계산에 조금 혼란 스러워요 enter image description hereKmeans 클러스터 평가

경우

|Ci| is the size of cluster i 
ci is the centroid of cluster i 
c is the centroid of the overall data 

이 "전체 데이터의 중심"는 무엇입니까? 어디서나 전체 데이터의 중심으로 언급됩니다.

우리가 계산을 위해 취한 초기 중력입니까? anony - 무스의 대답에서

편집

조금 더 설명.

클러스터링에서 1 반복을 수행했다고 가정 해 보겠습니다.

step 1: k =2, select random centroids(Let my random centroids be (2,1,3) and (3,1,1)) 
step 2: do clustering(Now 2 clusters are formed) 
step 3: then find new centroids(by averaging data for each cluster, After averaging let my new clusters be (2.3,1.5,3) and (6.7,1,2)) 

이제 SSB를 계산해야합니다.

가 지금은 그 값이 될 수 있도록 전체 데이터 (입력 데이터)에 대한 중심을 계산해야합니다 (25,30.5,78)

total no of values in c1 = 20 
total no of values in c2 = 30 

ssbc1 = 20*(dist([2.3,1.5,3],[25,30.5,78]))^2 
ssbc1 = 30*(dist([6.7,1,2],[25,30.5,78]))^2 
total ssb = ssbc1+ssbc2 

는이 같은가요?

답변

0

무게 중심은 각 치수의 평균입니다.

"모든 데이터 중"은 클러스터링이 이 아니며이 사용되었다고 말합니다.

+0

확인. 내 편집을 볼 수 있니? –