먼 먼 무게 중심을 찾는 것은 여기 kmeans 알고리즘을 사용하는 방법에 대한 예입니다 kmeans

를 사용하여 클러스터링 :이 예에서는 http://mnemstudio.org/clustering-k-means-example-1.htm 먼 먼 무게 중심을 찾는 것은 여기 kmeans 알고리즘을 사용하는 방법에 대한 예입니다 kmeans

는, 저자는 유클리드 거리 측정을 사용하여 초기 무게 중심 "멀리 떨어져 두 사람 (으로 사용) "라고 말했다.

두 개의 클러스터가 아니라 10 개가 필요한 경우 어떻게해야합니까? 첫 번째 10 센티 로이드는 어떻게 선택합니까? 10 명의 개인을 가장 멀리 선택하는 방법이 있습니까? 아니면 다른 방법으로 선택해야합니까?

추신 : 내 경우에는 랜든 선택을 사용하면 좋지 않을 것이라고 생각합니다. 또한 나는 처음 10 명의 개인을 중심으로 사용하려고 노력해 왔지만 그들을 선택할 수있는 더 나은 방법을 찾고 있습니다.

출처

2014-04-21 MariaH

K를 가장 멀리 떨어져있는 엔티티를 초기 중심으로 선택하는 것은 다소 위험합니다. 실세계 데이터 세트는 특이점을 갖는 경향이 있으며, 접근 방식에서는 초기 중심 값으로 선택됩니다.

K-Means에는 많은 초기화 알고리즘이 있습니다. 아마도 지능형 K-Means를보고 싶을 것입니다.

출처

2014-04-23 16:15:03

초기 중량 중심을 선택하는 가장 일반적인 방법은 무엇입니까? – MariaH

아마도 대부분의 사람들은 K-Means를 여러 번 (100 번) 실행 한 다음 가장 작은 K-Means 출력으로 클러스터링을 선택한다고 생각합니다. 데이터 세트가 너무 커서 K-Means를 여러 번 실행할 수없는 경우 지능형 K- 평균을 제안합니다. –

내 데이터 세트에는 69 개의 요소가있어 8 개의 클러스터로 그룹화됩니다. 요소 0, 9, 18, 27, 36, 45, 54, 63을 첫 번째 중심으로 선택하면 Kmeans는 각 클러스터의 요소의 평균에 따라 이러한 중심을 6 번 재구성 한 다음 수렴합니다. – MariaH

초기 중심선을 선택하는 가장 일반적인 방법은 kmeans ++ http://en.wikipedia.org/wiki/K-means%2B%2B 을 사용하는 것입니다. 이론적 인 성능 보장.

http://ilpubs.stanford.edu:8090/778/1/2006-13.pdf

많은 파이썬 클러스터링 패키지에는 mlpy, scipy KMeans 등이 초기화를 구현합니다. 하지만 나는 자바에 대해 모른다.

출처

2014-05-23 15:45:25

먼 먼 무게 중심을 찾는 것은 여기 kmeans 알고리즘을 사용하는 방법에 대한 예입니다 kmeans

답변

관련 문제