2012-10-20 2 views
1

보낸 사람의 이름,받는 사람, 단어와 20 단어 사이의 짧은 메시지, 스팸/스팸이 아닌 클래스가 포함 된 데이터 세트가 있습니다. 이 기록 데이터를 기반으로 일련의 연관 규칙을 만들고 싶습니다. Apriori 알고리즘을 생각하고 있었지만 데이터 집합을 통해 알고리즘을 실행하기 위해 짧은 메시지를 이산화하는 방법을 모르겠습니다. 목표는 스팸 분류가 아닌 스팸으로 이어지는 규칙을 추출하는 것입니다.짧은 메시지에 대한 연관 학습

답변

1

Naive Bayes/SVM이 이러한 종류의 분류에 더 좋습니다. 각 단어를 하나의 기능으로 취급하십시오.

관련 문제