2012-01-10 4 views
2

잠재적 인 클러스터 또는 노드 그룹 (이 경우 포럼 메시지)을 찾으려고합니다.인접 매트릭스/에지 목록에서 클러스터 생성 R

현재 데이터에서 각 노드 (메시지)는 n 개의 다른 메시지와 함께 잠정적으로 그룹화되었으며 해당 그룹에는 이름이 지정되었습니다. 그래서 우리는 msg ID 1이 msg ID 3, 7과 함께 보여 졌다고 말합니다.

저는 현재 그 정보를 사용하여 가장자리 목록을 구성하고 있습니다 (가장자리 목록이있는 경우 모서리가있는 경우). 그런 다음 워크 트랩 커뮤니티를 사용하여 덴도 그램을 만듭니다.

가장자리 목록이 주어지면 다른 그룹이나 클러스터를 해킹 할 수 있습니까? (나는 R을 사용하고 있지만 포인터는 도움이 될 것입니다.)

시간 내 주셔서 감사합니다.

내가 R에 대해 잘 모르는

답변

3

,하지만 ...

This overview paper는 훌륭한 세부 사항에 그래프 클러스터링에 대해 설명합니다. Markov clustering (MCL) 알고리즘에도 관심이있을 수 있습니다.

1

R의 네트워크 분석의 경우 igraph를 사용하는 것이 좋습니다. 이미 사용하고 계십니까? 그것은 다른 클러스터링 방법을 사용하여 dendrograms의 건설을 허용합니다. 그런 다음 community.to.membership()을 사용하여 덤 드로 그램을 자릅니다. MCL 알고리즘은 igraph에서 아직 사용할 수 없지만 명령 행에서 매우 쉽게 실행할 수 있습니다.

1

일반적인 포괄적 인 접근 방식은 데이터에 대한 인접성 매트릭스를 작성한 다음 행렬 곱셈을 사용하여 일종의 전이 클로저를 작성하는 것입니다. "이유"를 식별하기 위해 역행렬을 계산하거나, 그룹을 식별하기 위해 PCA/ICA를 계산하십시오.