저는 며칠 이상이 논문 (http://www.siefkes.net/papers/mrf-spamfiltering.pdf)을 보았지만 3 단원 이후의 수식을 이해하지 못했습니다. 문서가 주어진 단어의 조건 스팸가에 있음을 은/* 을 확률 | (C (w) = s의 w)Markov 차별 알고리즘을 설명하는 문제를 이해하는 데 문제가 있습니다.
P를 : 특히
, 나는이 부분이 무슨 뜻인지 이해가 안 돼요 스팸이 되는가? */
P | /* 인가 (W) C (= w 스팸)이 이전의 표현과 동일 확률? 왜 "스팸"대신에 "스팸"또는 그 반대입니까? 논문에서
/* (() 스팸 w {첨자 C와 제품 연산자}) */
{첨자 "클리크의 C"와 상품 연산자}, 최 식은 의미라고 지역 확률, 그러나 나는 표기법을 이해하지 않는다. 제품 운영자 다음의 (w, 스팸)이 주문 집합이나 기능입니까? 그것은 무엇의 기능입니까? */
나는 2 진수 계수가있는 수식을 이해하지 못한다.하지만 최소한 나는 읽어야하는 것을 알고 있다고 생각한다.
나는이 상황이 어떤 맥락에서 궁금한가요? 구현에 사용하려고하거나이 연구와 관련이 있습니까? –
종류 모두. 스팸 필터링 기능이 내장 된 유즈넷 리더를 만들고 있습니다. 나는 꽤 잘 작동하는듯한 꽤 표준적인 Graham Baynesian 필터를 가지고 있지만, 나는이 Markovian 접근법에 그 우월성 때문에 흥미가있다. – kittykitty