2015-01-28 2 views
0

scipy.cluster.hierarchy.linkage을 사용하여 데이터의 연결 구조를 계산하고 싶습니다. 내가 사용해야하는 유사성 측정 값은 Mutual Information입니다. 나는 상응하는 유사 매트릭스를 쉽게 계산할 수있다. 그러나 linkage 함수는 거리 매트릭스 만 허용합니다.유사성 측정으로 상호 정보를 사용하는 계층 적 클러스터링?

scipy (또는 다른 python lib)를 사용하여 어떻게 상호 정보를 유사성 측정으로 사용하여 연결 구조를 계산할 수 있습니까? Similiary 행렬을 거리 행렬로 변환 할 수 있습니까?

+0

'해당 유사성 매트릭스를 쉽게 계산할 수 있습니다. 그러나, 연계 함수는 단지 거리 행렬만을 수용한다. 유사성과 거리는 다소 비슷한 개념입니다. 유사점을 거리 점수로 변환하는 좋은 방법을 찾으려고 할 수 없습니까? – cel

+1

http://en.wikipedia.org/wiki/Mutual_information#Metric은 재미 있고 어쩌면 관련있는 것 같습니다. – cel

+0

위키 페이지를 더 자세히 읽어야합니다. –

답변

0

은 상호 정보의 거리 변형입니다. scipy의 distance.pdist 모듈은 Jaccard 거리를 사용하여 거리 매트릭스를 계산할 수 있습니다.

관련 문제