2014-04-21 7 views
0

를 사용하여 클러스터링 :이 예에서는 http://mnemstudio.org/clustering-k-means-example-1.htm먼 먼 무게 중심을 찾는 것은 여기 kmeans 알고리즘을 사용하는 방법에 대한 예입니다 kmeans

는, 저자는 유클리드 거리 측정을 사용하여 초기 무게 중심 "멀리 떨어져 두 사람 (으로 사용) "라고 말했다.

두 개의 클러스터가 아니라 10 개가 필요한 경우 어떻게해야합니까? 첫 번째 10 센티 로이드는 어떻게 선택합니까? 10 명의 개인을 가장 멀리 선택하는 방법이 있습니까? 아니면 다른 방법으로 선택해야합니까?

추신 : 내 경우에는 랜든 선택을 사용하면 좋지 않을 것이라고 생각합니다. 또한 나는 처음 10 명의 개인을 중심으로 사용하려고 노력해 왔지만 그들을 선택할 수있는 더 나은 방법을 찾고 있습니다.

답변

1

K를 가장 멀리 떨어져있는 엔티티를 초기 중심으로 선택하는 것은 다소 위험합니다. 실세계 데이터 세트는 특이점을 갖는 경향이 있으며, 접근 방식에서는 초기 중심 값으로 선택됩니다.

K-Means에는 많은 초기화 알고리즘이 있습니다. 아마도 지능형 K-Means를보고 싶을 것입니다.

+0

초기 중량 중심을 선택하는 가장 일반적인 방법은 무엇입니까? – MariaH

+1

아마도 대부분의 사람들은 K-Means를 여러 번 (100 번) 실행 한 다음 가장 작은 K-Means 출력으로 클러스터링을 선택한다고 생각합니다. 데이터 세트가 너무 커서 K-Means를 여러 번 실행할 수없는 경우 지능형 K- 평균을 제안합니다. –

+0

내 데이터 세트에는 69 개의 ​​요소가있어 8 개의 클러스터로 그룹화됩니다. 요소 0, 9, 18, 27, 36, 45, 54, 63을 첫 번째 중심으로 선택하면 Kmeans는 각 클러스터의 요소의 평균에 따라 이러한 중심을 6 번 재구성 한 다음 수렴합니다. – MariaH