0

조정 된 랜드 인덱스 (ARI)는 두 클러스터를 비교하는 데 널리 사용되는 방법입니다. 불행히도, 나는 일반적으로 클러스터링 분석을 수행하고 비교 한 후에 음의 ARI를 얻습니다. 이러한 부정적인 ARI를 어떻게 클러스터의 차이점을 설명하기 위해 해석 할 수 있습니까? 그리고 나서 부정적인 ARI가 무의미하다면, 적절한 조치에 대한 제안?부정적인 조정 된 rand 색인을 어떻게 해석 할 수 있습니까?

답변

2

전혀 "의미가 없습니다".

음수 ARI는 동의가 무작위 결과에서 예상되는 것보다 적다고 말합니다. 이것은 결과가 '직각'또는 '보완'임을 의미합니다.

그러나 의도적으로 대체 클러스터링을 찾지 않는 한 자주 발생하지 않습니다. 어쩌면 구현 오류가 있습니까?

+0

감사합니다. 코드를 확인한 후 수정했습니다. 나는 부정적인 ARIs를 얻는 것이 가능하다는 것을 알았지 만,이 서류들은 어느 상황에서 얻을 수 있는지 설명하지 못했습니다. 그렇다면 클러스터링 결과가 '직각'이라는 것은 무엇을 의미합니까? – Elkan

+0

그들은 무작위보다는 더 다릅니다, 즉. 차이점에 * 패턴 *이 있습니다. 구현 오류가 우연히 발생하는 것보다 더 많이 발생하는 경우가 있습니다. –

관련 문제