2013-03-27 4 views
2

나는 최근에 this paper에 설명 된 것을 기반으로 Bag of Words 분류 알고리즘을 구현했습니다.혼란 행렬에서 ROC 그래프로

모두 잘 작동하지만 ROC 곡선 또는 정밀도 리콜 그래프를 사용하여 분류기의 정확도를 측정하고 싶습니다.

각 분류기에 대한 혼동 행렬을 쉽게 얻을 수 있지만 더 많은 점을 얻고 실제로 곡선을 그릴 때 어떤 매개 변수를 변경해야하는지 알지 못합니다.

누군가 나에게 설명해 주시겠습니까?

답변

0

ROC 곡선을 그리기 위해 분류기의 출력이 불연속 값이 아닌 연속 값이어야한다고 생각합니다. 예측 된 레이블이 연속 값인 경우 ROC 곡선에서 점을 계산하기위한 임계 값을 설정할 수 있습니다. 예측 된 레이블이 두 개의 클래스 (이산 값)에 있으면 ROC 곡선에서 한 점만 얻습니다.

http://en.wikipedia.org/wiki/Receiver_operating_characteristic