2011-12-02 5 views
1

동일한 초기 설정을 사용하여 K- 평균 및 K- 평균 방법을 동일한 데이터 세트에 적용하면 동일한 결과가 나타 납니까? 당신의 이유를 설명하십시오.K- 평균 및 순차 K- 평균에서 같은 결과가 나옵니까?

개인적으로 나는 대답이 아니오라고 생각합니다. 순차적 K- 평균에 의해 얻어진 결과는 데이터 포인트의 제시 순서에 달려 있습니다. 그리고 끝 조건은 동일하지 않습니다.

두 클러스터링 알고리즘의 의사 코드를 연결합니다.

Make initial guesses for the means m1, m2, ..., mk 
Until there is no change in any mean 
    Assign each data point to the cluster whose mean is the nearest. 
    Calculate the mean of each cluster. 
    For i from 1 to k 
     Replace mi with the mean of all examples for cluster i. 
    end_for 
end_until 

순차

Make initial guesses for the means m1, m2, ..., mk 
Set the counts n1, n2, ..., nk to zero 
Until interrupted 
    Acquire the next example, x 
    If mi is closest to x 
     Increment ni 
     Replace mi by mi + (1/ni)*(x - mi) 
    end_if 
end_until 

답변

5

가 올바른 결과가 상이 할 수는 K-K-수단을 의미한다.

포인트 : x1 = (0,0), x2 = (1,1), x3 = (0.75,0), x4 = (0.25,1); m1 = (0,0.5), m2 = (1.0.5). K-means는 x1과 x4를 m1 클러스터에 할당하고 x2와 x3을 m2 클러스터에 할당합니다. 새로운 수단은 m1 '= (0.125,0.5) 및 m2'= (0.875,0.5)이며, 재 할당은 일어나지 않습니다. 순차적 인 K 평균을 사용하면 x1이 할당 된 후 m1이 (0,0)으로 이동하고 x2가 m2를 (1,1)로 이동합니다. 그러면 m1은 x3에 가장 가까운 평균이므로 m1은 (0.375,0)으로 이동합니다. 마지막으로, m2는 x4에 가장 가깝기 때문에 m2는 (0.625,1)로 이동합니다. 이는 다시 안정적인 구성입니다.

+0

사례 증명에 의한 증명이므로 케이스 폐쇄 +1 –

+0

이해해 주셔서 감사합니다. –

관련 문제