2013-10-16 2 views
2

L과 D가 둘 다 발생할 확률 P (L, D)를 계산해야하지만, 상호 독립적이지 않습니다. P (L | D)와 P (D | L)을 알고 있습니다. 관련된 확률을 결합하기

P(L) * P(D|L) and 
P(D) * P(L|D) 

내가 나는 최고의 단지 결합 된 P (L, D)에 대한이 두 추정치를 평균 오프 : 지금까지 내가 그것을 볼 수있는 나는 P의 두 개의 서로 다른 추정 (L, D)가?

+3

http://stats.stackexchange.com/ – NPE

답변

1

조인트 분포를 계산하는이 두 가지 방법은 수치 정밀도 내에서 동일해야합니다. 알고리즘이이 두 가지 방법에 대해 다른 대답을 제공하면 코드의 버그입니다.

2 진 변수 쌍의 경우, 수행 결과 각각 ((L,D), (!L,D), (L,!D), (!L,!D))을 유지해야합니다. 우리는 관심있는 확률이 그냥 Z=N(L,D)+N(!L,D)+N(L,!D)+N(!L,!D)

을 할 경우

P(L,D)=N(L,D)/Z 

다른 (한계, 조건) 확률은 다음과 같습니다 당신이 볼 수있는 약간의 대수와

P(L)=[N(L,D)+N(L,!D)]/Z 
P(D)=[N(L,D)+N(!L,D)]/Z 

P(L | D) = N(L,D)/[ N(L,D)+N(!L,D)] 
P(D | L) = N(L,D)/[ N(L,D)+N(L,!D)] 

P(L|D)P(D)=N(L,D)/Z=P(D|L)P(L)

이 점은 개별 견적을 단일 견적서에 결합하는 방법을 가리 킵니다. "카운트"로 돌아간 다음이 카운트를 추가하십시오. 이것이 일어날 수있는 경우는 두 개의 독립 샘플 S1, S2입니다. 샘플 S2S1P(D |L), P(L)의 으로 추정했다고 가정합니다. 확률에 외에도, 우리는 각각의 샘플에있는 샘플의 수를 알아야합니다 : N1,N2. 참고 : 결과는 비율이 N1/N2 인 경우에만 적용되므로 카운트가 없지만 샘플 크기가 항상 동일하다는 것을 알고 있다면 N1=N2=1을 다음으로 대체 할 수 있습니다.

N(L,D | S1) = N1*P(L | D) P(D) 
N(L,D | S2) = N2*P(D | L) P(L) 

N(L,D | S1+S2) = N(L,D|S1)+N(L,D|S2) 
P(L,D | S1+S2) = N(L,D|S1+S2)/(N1+N2) 

N1==N2의 경우에 이들 중 어느 하나를 평균 한 것입니다. 그러나 이것은 표본 크기가 같은 특수한 경우에만 해당됩니다. 그렇지 않은 경우 결과는 가중 평균입니다.

이것은 견적가가 상호 연관되거나 경험적 확률 이외의 양을 추정하는 경우를 처리하는 this question on CrossValidated에 대한 Bill의 답을 단순화 한 것입니다.

+0

에 대한 더 나은 답변을 얻을 것으로 의심됩니다. P (L) 및 P (D)는 다른 견적 모델에 의해 생성됩니다. 그들은 진정한 확률이 아닙니다. –

+1

그들이 확률 이론의 공리를 만족시키지 않는다면, 아마도 그것을 다루지 않아야한다. 이 경우 귀하의 질문은 "어떻게하면 두 가지 임의의 발견 적 방법으로 믿음을 결합 할 수 있습니까?"입니다. 그러나 어쨌든, 도움이 될만한 것들을 결합하는 방법에 대한 추가 설명을 추가했습니다. 그러나 실제로 대답은 : 확률을 직접 추정하십시오. – Dave