2016-11-10 1 views
0

ward 방법을 사용하여 scipy linkage을 사용하여 많은 특징 벡터를 클러스터링합니다. Scipy 계층 적 클러스터링 - 새로운 벡터 클러스터링

나는 두 단계로 작동하는 예측 모델을 원하는 :

  1. 훈련 데이터가 clusterized됩니다
  2. 새로운 벡터는 벡터와 각 클러스터 사이의 거리가 계산되고, 제공, 새로운 벡터를 할당 "가장 가까운"클러스터 레이블

어떻게 새 벡터와 미리 계산 된 클러스터 사이의 거리를 계산할 수 있습니까?

답변

0

유클리드 측정 기준을 사용 하시겠습니까? 미리 계산 된 클러스터에는 중심이 있다고 생각합니다. 따라서 모든 중심과 새로운 벡터 사이의 거리를 계산할 수 있습니다.

+0

링크가 클러스터 센터를 반환한다고 생각하지 않습니다. 내가 직접 계산해야합니까? – Euphe

+0

그래, 그게 최선의 방법이라고 생각해. 모든 중심 벡터를 저장할 수 있습니다. 그런 다음 벡터를 추가하면 영향을받는 클러스터의 중심 벡터 만 업데이트하면됩니다. –

관련 문제