누군가 거리 매트릭스를 입력으로 사용할 수있는 클러스터링 알고리즘을 제안 할 수 있습니까? 또는 거리 매트릭스를 기반으로 클러스터링의 "장점"을 평가할 수있는 알고리즘?거리 매트릭스를 입력으로 클러스터링하는 [평가] 알고리즘
현재 데이터를 두 개의 클러스터로 나누기 위해 Kruskal의 알고리즘 (http://en.wikipedia.org/wiki/Kruskal%27s_algorithm)을 수정했습니다. 그것은 문제가있다. 데이터에 별개의 클러스터가없는 경우에도 알고리즘은 하나의 요소가 포함 된 하나의 클러스터와 나머지 요소가 모두 포함 된 두 개의 클러스터를 생성합니다. 이 경우에는 모든 요소가 포함 된 하나의 클러스터와 비어있는 하나의 클러스터가 있습니다.
이러한 유형의 클러스터링을 수행 할 수있는 알고리즘이 있습니까?
클러스터링이 얼마나 잘 수행되었는지 또는 더 많은 클러스터가 데이터에 존재 하는지를 예측할 수있는 알고리즘이 있습니까?
알고리즘은 거리 (유사성) 행렬 만 입력으로 사용해야합니다.
K- 가장 가까운 이웃 (http://en.wikipedia.org/wiki/KNN)은 간단하고 효과적인 클러스터링 알고리즘입니다. 조금만 조정하면 필요한 것을 줄 수 있습니다. – Amichai
K nearest neighboures - 원점에서, 분류 알고리즘입니다 (클러스터링에서 어떻게 사용하는지 모르겠습니다). 대부분의 famouse 중 하나는 K 평균 클러스터링입니다. (http://en.wikipedia.org/wiki/K-means_clustering) – Max
원본 형식으로 알고있는 한이 알고리즘에 대한 좌표가 필요합니다.이 알고리즘에는 없습니다. 거리 행렬과 함께 작동하도록 조정하려면 어떻게해야합니까? – Max