서비스 공급자가 사용하는 스팸 필터링 (사용자 정의)

다양한 전자 메일 서비스 공급자가 구현 한 스팸 필터링 기술에 대해 배우고 있습니다. 정확하게 이것은 분류 문제로 취급되며 베이지안 (Bayesian), SVM (Support Vector Machines), KNN 등과 같은 다양한 기술을 사용하여 분류 모델을 생성합니다.서비스 공급자가 사용하는 스팸 필터링 (사용자 정의)

나는 이러한 방법론까지 모든 것을 이해했습니다. 그러나 사용자 맞춤 설정을 보았을 때 약간 혼란스러워졌습니다. Gmail에서 스팸 필터링을 위해 (스팸 또는 비 스팸이 될 메일을 선택할 수 있습니다). 이 옵션을 정확히 구현하는 방법. 그들은 각 사용자에 대해 별도의 분류 모델을 만들거나이를 수행 할 다른 옵션/기법이 있습니까?

웹에서 검색하려고했지만 만족스러운 결과를 얻지 못했습니다.

출처

2014-07-06 anuj pradhan

특징 해싱이 핵심입니다. –

각기 다른 사람들은 각기 다른 선호도를 가지므로 각 사용자별로 별도의 분류 모델이 필요합니다. 효율성을 위해 사용자를 다른 모델을 가진 여러 그룹으로 나눕니다. 가장 어려운 것은 데이터 수집입니다. 데이터가 불완전하고 오류가 발생하기 쉽고 액세스 할 수없는 경우가 종종 있습니다.

출처

2014-07-06 13:16:06 JunWangCas

서비스 공급자가 사용하는 스팸 필터링 (사용자 정의)

답변

관련 문제