0

저는 계층 적 클러스터링을 효율적으로 묘사하는 데 사용되는 멍도 그램을 구현하는 방법을 연구했습니다. 현재 정규식을 사용하여 구문 분석하고 아래와 같이 트리 구조처럼 표시합니다.dendrogram에 사용할 데이터 구조는 무엇입니까?

[[2,1],[3]] 

이 세 개의 문서가 의미 레벨 1은 두 개의 클러스터 중 하나가 포함 된 문서 (2) (1)를 포함하고, 다른 하나는 우리가 특정 레벨에서 Dendrogram이 절단 후에 클러스터를 얻을로만 문서 3 를 포함한다. 표시된 정규 표현식을 자르는 것은 어렵고 항상 적절한 클러스터를 제공하지는 않습니다.

dendrogram에서 클러스터를 얻는 것이 비교적 쉽도록 어떤 데이터 구조와 표현을 사용해야합니까?

답변

0

SLINK 알고리즘에서 사용하는 포인터 표현을 사용할 수 있습니다.

부모 개체에 대한 참조 및 클러스터에 가입하는 거리입니다. 여기

, 그냥 너무 높은 결합 높이가 모든 가장자리를 삭제, 추출 클러스터에 대한

2 parent 1 height 1 
1 parent 3 height 2 
3 parent nil height inf 

될 것이다.

관련 문제