나는 정보 검색에 할당 있고 난 그 부분 사양을 생성, 내가 여기에 같은 단어의 값을 의미하는 방법을 깨달을 수 없었다 안녕하세요 : http://nlp.stanford.edu/IR-book/html/htmledition/finite-automata-and-language-models-1.htmlParticial 사양
= 0.2
을 a = 0.1
개구리 = 0.01 ... 등등. 누군가가이 값을 계산하는 방법을 설명하면 감사 할 것입니다.
언어 모델에 대해 자세히 알아보십시오!
a) 아이디어를 설명하십시오!
b) 다음 문서 콜렉션을 고려하십시오.
D1 : 오늘 맑음. 맑은 베를린! 있어야하거나 될 수 없습니다.
D2 : 그녀는 오늘 베를린에 있습니다. 그녀는 화창한 소녀입니다. 베를린은 항상 흥미 진진합니다!
각 문서에 해당하는 Unigram Language Model을 계산하십시오! 정지 확률을 모델에 xed (0 : 2와 같음)라고 가정합니다. ! 쿼리 \ 맑은 베를린 "주어진 문서를 평가하기 위하여 이러한 모델에게 그 단어의 값은 페이지가 계산되지 않습니다