해석 - VoidCC

, 우리는 nb 객체를 사용하여 테스트 데이터에 posterior 함수를 호출 할 수 있습니다.해석

[포스트의 cpre,적인 log P] = 후부 (NB, 시험) 그

I 계산 방법 post 이해 의미도 cpre가 예측된다 :이 함수는 3 개 출력 매개 변수를 갖는다 각 클래스에 대한 사후 확률의 최대 값을 기반으로합니다.

질문은 logp입니다. 계산 방법 (테스트에서 각 패턴의 PDF 로그)은 명확하지만이 측정의 의미와 Naive Bayes 절차의 컨텍스트에서이 측정 방법을 어떻게 사용할 수 있는지 이해하지 못합니다. 이것에 대한 어떤 빛이라도 대단히 감사합니다.

감사합니다.

출처

2013-03-22 Oleg Shirokikh

logp은 log likelihood으로 모델이 얼마나 잘 맞는지 측정하는 방법 중 하나입니다. 로그 확률을 사용하여 매우 작은 부동 소수점 숫자로 컴퓨터가 언더 플로우하는 것을 방지하고, 곱셈보다 더 빨리 덧셈이 수행되기 때문입니다.

다른 시작점을 사용하여 여러 번 분류자를 학습 한 경우 우도 함수가 로그 오목 형이 아니기 때문에 결과가 달라질 수 있습니다. 즉, 붙어있는 로컬 최대치가 있다는 의미입니다. 사후 데이터를 사 용하면 모델의 가능성을 알 수 있습니다. 비록 가능성이 당신에게 하나의 매개 변수 집합이 다른 매개 변수와 어떻게 다른지에 대한 좋은 측정법을 제공하지만, 당신이 overfitting이 아니라는 것을주의해야합니다.

귀하의 경우, 관찰되지 않은 (테스트) 데이터에 대한 가능성을 계산하여 학습 된 분류자가 데이터에 얼마나 잘 어울리는지를 알 수 있습니다. 테스트 세트를 기반으로이 모델을 배우려고하면 가장 높은 테스트 가능성을 기준으로 매개 변수를 선택합니다. 그러나 일반적으로이 작업을 수행 할 때는 validation set을 사용하는 것이 좋습니다. 여기서 뭘하는지는 predictive likelihood입니다.

로그 가능성을 계산하는 것은 Naive Bayes 분류 자에 국한되지 않으며 실제로 모든 베이지안 모델 (가우시안 혼합, 잠재 디리클릿 할당 등)에 대해 계산할 수 있습니다.

출처

2013-03-22 18:59:22

답변 해 주셔서 감사합니다. 각 테스트 포인트의 PDF가 [0,1] 범위에 있기 때문에'logp'는 (-infinity, 0)에있을 것입니다.이 측정 값 (logp)이 높을수록 우리의 맞춤 분류기가 새로운 패턴을 더 잘 예측한다는 것을 알 수 있습니다. 올바른지? 또한 예측 클래스가 모든 사후 확률의 최대 값에 따라 선택된다는 것도 맞습니까? 아니면이 경우에도 로그를 가져 오겠습니까? 감사합니다 –

[logp']는 [singularities] (http : //stackoverflow.com/a/15563245/586086) PDF는 1로만 통합되며 1보다 큰 것으로 평가 될 수 있습니다. 여기에서하는 일은 [예측 가능성 (predictive likelihood)] (http : //en.wikipedia. org/wiki/Posterior_predictive_distribution). –

덕분에 링크가 매우 유용합니다. 따라서 단순히 새로운 데이터 포인트에 대해'logp = x'를 관찰하면이 'x' 값으로부터 어떤 추론을 할 수 있습니까? 다른 점들과 비교했을 때 상대적인 정보만을 말해라. 예를 들어, x가 0보다 크거나 큰 양의 큰 음수라면 –

해석

답변

관련 문제