2014-02-07 5 views
0

저는 Scikit-learn에서 AdaBoostClassifier를 사용하고 있으며 훈련 세트의 불균형에 관계없이 평균 확률은 항상 0.5입니다. 클래스 예측 (predict_)은 정확한 예측을 제공하는 것으로 보이지만, 이들은 항상 평균 0.5 인 predict_probas 메소드에 반영되지 않습니다.예측 방법은 표준화 된 확률을 나타 냅니까?

"실제"확률이 0.02이면 표준 확률을 그 비율을 반영하도록 어떻게 변환합니까?

답변

0

평균적으로 1/n_classes 인 샘플 당 확률이 있습니까? 그것은 꼭 필요한 경우입니다. predict_proba에 의해보고 된 확률은 y에 대한 모든 값에 대한 조건부 확률 분포 P (y | X)입니다. 다른 확률을 생성하려면 확률 모델에 따라 필요한 계산을 수행하십시오.

+0

예. NaiveBayes 알고리즘에는 class_prior 매개 변수가 있습니다 (예 : [0.2, 0.8]). 이것은 AdaBoostClassifier가 허용하지 않더라도 내가 찾고있는 것 같습니다. 내가 이전에 해당하는 숫자를 얻기 위해 predict_proba 응답에 클래스의 역 (1/0.2 또는 1/0.8)을 곱하는 것이 옳은가? –

+0

@OlaGustafsson 당신이 원하는대로 번식하실 수 있습니다. 이후에 재 정규화하면, 이전에 추가 된, 즉 일종의 혼합 모델을 가진 분류 자입니다. –

관련 문제