2016-11-03 3 views
0

skelarn의 인터페이스를 사용하여 dbscan의 결과를 평가했습니다. 문서에 따르면 F measure는 분류 메트릭이지만 dbscan은 클러스터링 방법입니다. 이론적으로 클러스터링을위한 외부 평가 방법으로 F 측정 값을 사용할 수 있다는 것을 알고 있습니다. 그렇다면이를 dbscan의 결과를 평가하는 데 어떻게 활용할 수 있습니까?dbscan의 결과를 평가하기 위해 f-measure를 사용합니다.

답변

0

정밀도와 리콜을 정의하는 방법에 따라 f- 척도가 두 개 이상 있습니다. F는 단순히 정밀도와 리콜의 기하학적 평균이기 때문에.

ELKI를 사용하는 경우 ELKI가 자동으로 계산됩니다.

그러나 문제는 클러스터링 알고리즘이 노이즈를 생성 할 때 정확도와 리콜의 정의입니다 (DBSCAN처럼). 소음은 클러스터가 아닙니다. 그러나 그 때 그것은 무엇입니까? 소음의 품질을 어떻게 평가합니까? 어떻게 클러스터와 노이즈를 동시에 평가합니까?

많은 클러스터링 평가 방법이 불행하게도 잡음의 경우를 처리하지 못합니다. 나는 정말로 설득력있는 한 가지 방법을 알지 못합니다. 소음 처리.

+0

F- 측정을 기반으로 내 자신의 실현을 할 필요가있어서 고마워요. 내가 집중해야 할 것은 노이즈 처리입니다. 맞습니까? – AppleFairy

+0

잡음은 이론적 인 문제입니다. 이것을 논의한 논문이 있었는데 (나는 Campello에 의해 그것을 믿었습니까?) 그것은 아마도 출발점 일 것입니다. 그것은 쉬운 것으로 보인다. –

+0

내가 올바르게 기억한다면, ELKI는 Campello가 토론 한 다양한 전략을 구현했습니다. 따라서 기사에 대한 언급은 소음을 다루는 ELKI 소스에 있어야합니다. –

관련 문제