, 우리는 nb
객체를 사용하여 테스트 데이터에 posterior
함수를 호출 할 수 있습니다.해석
[포스트의 cpre,적인 log P] = 후부 (NB, 시험) 그
I 계산 방법 post
이해 의미도 cpre
가 예측된다 :이 함수는 3 개 출력 매개 변수를 갖는다 각 클래스에 대한 사후 확률의 최대 값을 기반으로합니다.
질문은 logp
입니다. 계산 방법 (테스트에서 각 패턴의 PDF 로그)은 명확하지만이 측정의 의미와 Naive Bayes 절차의 컨텍스트에서이 측정 방법을 어떻게 사용할 수 있는지 이해하지 못합니다. 이것에 대한 어떤 빛이라도 대단히 감사합니다.
감사합니다.
답변 해 주셔서 감사합니다. 각 테스트 포인트의 PDF가 [0,1] 범위에 있기 때문에'logp'는 (-infinity, 0)에있을 것입니다.이 측정 값 (logp)이 높을수록 우리의 맞춤 분류기가 새로운 패턴을 더 잘 예측한다는 것을 알 수 있습니다. 올바른지? 또한 예측 클래스가 모든 사후 확률의 최대 값에 따라 선택된다는 것도 맞습니까? 아니면이 경우에도 로그를 가져 오겠습니까? 감사합니다 –
[logp']는 [singularities] (http : //stackoverflow.com/a/15563245/586086) PDF는 1로만 통합되며 1보다 큰 것으로 평가 될 수 있습니다. 여기에서하는 일은 [예측 가능성 (predictive likelihood)] (http : //en.wikipedia. org/wiki/Posterior_predictive_distribution). –
덕분에 링크가 매우 유용합니다. 따라서 단순히 새로운 데이터 포인트에 대해'logp = x'를 관찰하면이 'x' 값으로부터 어떤 추론을 할 수 있습니까? 다른 점들과 비교했을 때 상대적인 정보만을 말해라. 예를 들어, x가 0보다 크거나 큰 양의 큰 음수라면 –