2011-05-09 6 views
0

나는 포인트를 가지고 있으며, 나는 그 중에서 클러스터를 원한다. 나는 정상적인 k-means 알고리즘을하는 법을 안다. 하지만 나는 'k'를 입력으로 사용하고 싶지 않습니다. 1,3,4,50607010001000210004와 같은 포인트가 있다고 가정하면 알고리즘은 3 클러스터로 클러스터링합니다. C1 : 1,3,4 012 : C2 : 50,60,70 012 : 0,60,70 C3 : 100010021004 클러스터 내 요소 간 거리를 만족해야하며 클러스터 간 거리가 최대가되어야합니다.무작위 클러스터링 알고리즘

+0

왜 "random"이란 단어를 사용 했습니까? – Gumbo

+0

@ Gumbo : k를 입력으로 사용하고 싶지 않으므로 간단히 임의 클러스터링을 호출했습니다. 그게 뭔가 다른 것인가? – Navin

+0

아마도 이것은 도움이됩니다 ... http://www.slideshare.net/pierluca.lanzi/machine-learning-and-data-mining-08- clustering-hierarchical – mkn

답변

0

k를 결정하는 것은 많은 클러스터링 알고리즘으로 반복되는 문제입니다. 스펙트럼 클러스터링 (및 다양한 알고리즘 사촌)을 고려하여 문제를 완화시킬 수 있습니다. 그러나 많은 버전에서는 최종 단계로 k-means를 사용하여 사용자를 정사각형으로 복귀시킵니다 (전부는 아니지만).

또는 위의 Denis에서 제공 한 답변과 같이 k의 최적 값을 찾는 많은 방법이 있습니다. 이것은 당신의 목적을 위해 충분할지도 모른다.