2011-03-05 10 views
0

키 - 값 유형의 벡터에서 k-means 클러스터링을 사용하려고합니다. 내 질문은, 어떻게 벡터의 각 요소의 좌표를 설정합니까? 특히 키 - 값 쌍은 strings-floats입니다. 나중에 클러스터의 중심을 찾으려면이 항목이 필요합니다.k-means에서 클러스터 좌표를 찾는 방법

+0

사람은 내가 그것을 봐 줄 수 알고 있나요? 2 차원 공간에서 각 요소를 정의해야한다는 것을 알고 있지만 어떻게해야합니까? 어떤 제안? 덕분에 – user579674

답변

2

클러스터링 알고리즘은 일반적으로 정점을 클러스터로만 분류합니다. 찾고있는 것은 클러스터 렌더링 알고리즘입니다.이 알고리즘은 그래프의 클러스터 파티션을 통해 그래프를 적절한 방식으로 렌더링합니다. 클러스터 알고리즘과 시각화 알고리즘을 분리 된 상태로 유지하는 것이 좋습니다. Force-directed 레이아웃은 좋은 클러스터 시각화 알고리즘입니다.

그리고 마지막으로 here은 구현에 대한 링크이고 another one입니다.

+0

. 나는 그들을 밖으로 검사 할 것이다. – user579674

0

K 평균 알고리즘은 일반적으로 클러스터의 중심을 계산합니다. R의 구현의 인스턴스를 들면 : 나는 C#에서 K-수단의 구현을 찾을 수있는

n.clin <- 10 
n.pop <- 100 
clinicdat <- data.frame(x=runif(n.clin), y=runif(n.clin)) 
popdat <- data.frame(x=runif(n.pop), y=runif(n.pop), pop=sample(1:5000, n.pop)) 
plot(popdat$y~popdat$x, col="grey") 
points(clinicdat$y~clinicdat$x, col="red") 
km <- kmeans(subset(popdat,select=c(x,y)), n.clin) 
points(fitted(km, method="centers"), col="green") 

enter image description here

관련 문제