2011-05-04 4 views
0

컬럼 A (클러스터 레이블이라고 부름)와 컬럼 B의 일부 속성 (클러스터 구성 요소라고 함)의 일부 레이블을 포함하는 Excel에 데이터 세트가 있습니다. 이 데이터는 최상의 클러스터링 결과를 보여줍니다.rapidminer에서 리콜과 정밀도

그러나 rapidminer에서 이러한 데이터를 사용하여 다른 클러스터링 방법의 리콜 및 정밀도를 계산하는 방법을 알지 못합니다!

아무도 도와 줄 수 있습니까?

답변

1

다음은 link으로, RapidMiner 연산자 인 "Map Clustering on Labels"를 사용하는 예가 나와 있습니다. 이렇게하면 알려진 클러스터 레이블이 클러스터링 알고리즘에 의해 할당 된 클러스터에 매핑됩니다. 이 결과를 사용하여 정밀도와 리콜을 결정할 수있는 혼동 행렬을 생성 할 수 있습니다.

는 ... 희망이 도움이

0

당신은 클래스보다 수있을 때/정밀도 레이블 및 리콜 개별 클래스로 가지고 있습니다.