2011-07-05 6 views
2

나는 라벨 분류를 위해 말렛에 maxent algo를 사용하고 있습니다. 나는 최대 분류 자에 의해 예측 된 레이블에 대해 어떤 종류의 신뢰도 값을 얻을 수 있는지 궁금해하고있었습니다. 기본적으로 필요한 것은 분류기가 가장 신뢰할 수있는 상위 K 예측 (각 토큰이 아닌 전체 데이터에서) 인스턴스이며 부트 스트랩에 사용합니다. 이 일을 할 수있는 방법이 있습니까?Mallet : Maxent 알고리즘의 신뢰도 값을 얻으십시오.

답변

2

말렛 분류법을 호출 할 때 반환되는 Labeling 객체를 살펴보십시오. 이 클래스는 각 레이블에 대해 계산 된 모든 점수를 포함합니다. 가장 좋은 것이 답이됩니다 (이것은 getBestLabel() 메소드에 의해 리턴 된 것입니다). 문지르는 것은 보통이 점수가 확률이 아니라는 것입니다. 저는 말렛의 최대 분류 자에 익숙하지 않습니다. 코드를보고 반환 된 점수를 어떻게 든 "캐스팅"할 수 있는지 또는 이미 적절한 형식인지 여부를 결정해야합니다. 어쨌든 당신이하고자하는 것은 상위 K 점수 사이의 상대적인 차이에 의미를 부여하는 것처럼 들린다. 다시 말하지만, 이것은 최대 분급기의 정확한 세부 사항에 달려 있습니다. 따라서 실제로 데이터 세트에 반환 된 Labeling 객체 인스턴스를보고 최선의 판단을 사용하십시오.

희망이 도움이됩니다.

관련 문제