2013-07-21 2 views
5

정확하게 두 가지 질문이 있습니다. 첫째, Markov Clustering Algorithm을 쉽게 적용 할 수있는 방법이 있는지 미리 알고 싶습니다. 마지막에 얼마나 많은 클러스터를 갖고 싶은지 미리 지정할 수 있습니다. 그렇지 않은 경우 어떤 유사한 알고리즘을 권장합니까?Markov Clustering

둘째, 마르코프 세계에서 중복되는 클러스터를 어떻게 처리해야합니까?

답변

13

1). MCL 알고리즘을 쉽게 적용 할 수있는 방법은 없습니다 (이름은 'Markov cluster algorithm'을 'ing'없이 사용합니다. 많은 사람들이 'Markov clustering'을하는 것처럼 말을합니다.). . 이것은 제 생각에 99.99 %의 시간이 매우 바람직한 특징입니다. 내가 원하는대로 할 수 있다면, 각기 다른 수준의 4 또는 5 개의 클러스터링을 생성 할 것입니다 (MCL 인플레이션 매개 변수를 1.4, 2.0, 3.0, 4.0 및 6.0으로 설정하는 것이 좋지만 몇 가지 작업을 수행하는 것이 좋습니다. 클러스터 크기의 분포를 기반으로 선택), 계층 적 클러스터링에서이를 통합하십시오 ('clm close'프로그램이이를 수행 할 수 있습니다). 그 후 트리를 가로 질러 원하는 크기의 최적 클러스터링을 찾으려고 할 수 있습니다. 분명히 상당한 노력이 필요합니다. 나는 비슷한 것을했지만 과거에는 아주 똑같은 것은 아닙니다.

2). MCL에 의해 생성 된 중첩 클러스터링은 극히 드문 경우이며, 항상 입력 그래프에서 대칭의 결과입니다. 대부분의 사람들이 사용하는 표준 MCL 구현 (http://micans.org/mcl/)은 중복을 제거합니다. 내 생각에 이것은 우려가되지 않습니다. 면책 조항 : 저는 MCL을 저술했습니다.

+0

실제로 이것은 실제로 좋은 아이디어입니다. 다른 인플레이션 값을 사용하는 것은 일종의 시도 및 오류이지만 실행 가능합니다. 감사. – user2560216

+0

현재 개발중인 mcl에는 입력 클러스터링이 지정된 새 옵션이 있습니다. 즉, 클러스터 간 에지를 제거하여 해당 클러스터링에 대한 하위 그래프를 구성하고 클러스터링을 진행합니다. 이것은 아마도 유용 할 수 있습니다. 또 다른 요점은 클러스터 수를 지정할 수있는 방법을 시도해 보셨습니까? 스펙트럼 방법 (나는 hmetis가 그런 방법이라고 생각한다) 또는 스펙트럼 클러스터링에 의한 그래프 파티셔닝? (그리고 다른 많은 방법이 있어야합니다). – micans

+0

@micans, 저는 MCL을 처음 접했고 다음 슬라이드를 살펴 보았습니다 : http://www.cs.ucsb.edu/~xyan/classes/CS595D-2009winter/MCL_Presentation2.pdf, 여기에 'power parameter 확장 동작을 제어하는 ​​'e'이다. 공식 MCL 설명서 (http://micans.org/mcl/man/mcl.html#options)에는이 매개 변수가 표시되지 않습니다. 암묵적으로 어딘가에 설정되어 있습니까? 그렇지 않다면 값을 선택하기위한 가이드 라인이 있습니까? – MLister