0
내가 클러스터 평가에서 SSB 계산에 조금 혼란 스러워요 Kmeans 클러스터 평가
경우
|Ci| is the size of cluster i
ci is the centroid of cluster i
c is the centroid of the overall data
이 "전체 데이터의 중심"는 무엇입니까? 어디서나 전체 데이터의 중심으로 언급됩니다.
우리가 계산을 위해 취한 초기 중력입니까? anony - 무스의 대답에서
편집
조금 더 설명.
클러스터링에서 1 반복을 수행했다고 가정 해 보겠습니다.
step 1: k =2, select random centroids(Let my random centroids be (2,1,3) and (3,1,1))
step 2: do clustering(Now 2 clusters are formed)
step 3: then find new centroids(by averaging data for each cluster, After averaging let my new clusters be (2.3,1.5,3) and (6.7,1,2))
이제 SSB를 계산해야합니다.
가 지금은 그 값이 될 수 있도록 전체 데이터 (입력 데이터)에 대한 중심을 계산해야합니다 (25,30.5,78)
total no of values in c1 = 20
total no of values in c2 = 30
ssbc1 = 20*(dist([2.3,1.5,3],[25,30.5,78]))^2
ssbc1 = 30*(dist([6.7,1,2],[25,30.5,78]))^2
total ssb = ssbc1+ssbc2
는이 같은가요?
확인. 내 편집을 볼 수 있니? –