2013-03-19 2 views
0

예제 데이터가 N 개의 클러스터 (각 클러스터는 센트로 드로 벡터를 가짐)에 클러스터 된 후에 K-Means에서 알 수 있듯이 모든 데이터가 속한 클러스터에 클러스터되지는 않습니다! 일부 데이터 벡터가 잘못된 클러스터에 클러스터 될 수 있습니다. 이것은 K-Means에서도 클러스터링하는 동안 100 %의 정밀도가 없음을 의미합니다. 나는 SOM 알고리즘에서도 그러한 "오류"가 발생하는지 궁금합니다. 그래서 ... SOM 알고리즘이 수렴 된 후에 실제로 놓인 노드에 속하지 않는 데이터 샘플이 있습니까?자체 구성 맵 "errors"

제 질문이 충분히 분명하기를 바랍니다. 나는 당신의 대답을 고대합니다.

답변

0

SOM은 제시된 입력에 따라 데이터를 클러스터링합니다. 클러스터의 형성은 입력이 네트워크에 제공되는 방식에 따라 다릅니다.

SOM은 맵 격자의 우승 노드와 실제 입력 벡터 사이의 거리를 최소화하여 입력을 클러스터링하고 바로 인접한 지역의 가중치를 적용합니다. 따라서 단일 클래스에 속하는 입력은 클러스터를 형성하는 동일한 위치에서 매핑됩니다.

그래서 알고리즘은이

  1. 데이터가 충분하지 않습니다 포인트가 네트워크를 훈련하기 위해 제시 한 다음과 같은 시나리오에서하지 않는 일이 일어날 것을 매우 가능성이 사용하는 학습 속도의
  2. 값이 적절한 하지
  3. 수렴 할 때
  4. SOM 클러스터가 올바르게 작동하고 클러스터링에 일반적인 (숨겨진) 기능이 표시되지 않으며 클러스터링에 실수가 있다고 생각하는 경향이 있습니다.

저는 SOM의 전문가는 아니지만 경험을 통해 대답합니다. 희망이 도움이됩니다.