2017-05-21 2 views
-1

데이터 매트릭스를 클러스터링하기 위해 PAM을 실행하고 싶습니다.PAM에서 "K"의 올바른 값을 선택하십시오.

하지만 지금은 올바른 방법으로 "K"값을 선택하는 방법을 이해하지 못했습니다.

최대 클러스터 수입니다.

마지막으로 ClusGap 이전에 PAM을 수행해야한다는 것이 맞습니까?

감사합니다. 이 휴리스틱

답변

0

당신이 일반적으로

  1. 모든이 최대까지 k에 대한 클러스터링 알고리즘 (K-수단, PAM)을 여러 번 실행됩니다 (그들은 최고의 진정한 K를 선택하지 못할 수 있습니다).
  2. 모든 k에 대해 SSQ (k-means의 경우) 또는 TD (PAM)를 사용하여 최상의 결과를 유지합니다.
  3. 그런 다음 당신이 모든 결과
  4. 플롯 휴리스틱에 따라 통계
  5. 의 곡선에 대한 귀하의 추론 통계를 계산, 무릎/팔꿈치/최소/최대 값을 선택합니다.
  6. 매우 비슷하다면 클러스터링 알고리즘이 작동하지 않을 가능성이 높습니다. 으로 바꾸어서 전처리를 변경하거나 다른 알고리즘을 사용해보십시오.
관련 문제