2013-01-03 4 views
0

다국적 Naive Bayes 모델에서 문서의 확률 공식에 조각의 의미 중 하나를 완전히 이해할 수는 없습니다. 그것은 종이 A Comparison of Event Models for Naive Bayes Text Classication, 공식 # 5에 관한 것입니다 :Multinomial Naive Bayes Model에서 문서의 확률

enter image description here

문제가 조각이 P(|d_i|)입니다 - 나는 완전히 이해할 수없는,이 확률은 무엇을 의미합니까? 단순히 i 번째 문서의 확률입니까? 그렇다면 왜 |...| 작업이 포함되어 있습니까?

답변

1

|d_i|은 i 번째 문서의 단어 수입니다. P(|d_i|) 용어는 정확히 |d_i| 개의 단어를 가진 문서를 생성 할 확률입니다.

+0

대단히 감사합니다! – Andremoniy

+0

당신은 정말로 혼란 스럽습니다. Naive Bayes는 내가 편집 한 LDA 수식과 아무런 관련이 없습니다. –

+0

정말요? 좋습니다. N 단어로 문서를 생성 할 확률을 계산하는 방법을 제안하는 방법은 무엇입니까? – Andremoniy