Wordpress에는 텍스트 블록을 스팸으로 분류 할 수있는 것으로 보이는 Akismet이라는 스팸 필터링 플러그인이 있습니다. 인터페이스와 데이터베이스/알고리즘을 통과해야하는 유일한주의 사항은 공개 소스이거나 쉽게 사용할 수있는 것이 아닙니다.무료 안티 스팸 데이터베이스가 있습니까?
웹 응용 프로그램의 사용자가 제출 한 이메일, 설명 또는 기타 텍스트를 분류 할 수있는 웹 액세스 API를 제공하는 상업용 제공 업체도 있습니다.
텍스트 블록을 스팸/비 스팸으로 분류 할 수있는 오픈 소스 또는 자유롭게 액세스 할 수있는 데이터베이스가 있습니까?
편집 : 여기에 내가 기본적으로 내가 특정 문구되는 스팸 메일의 확률로 밖에 광범위한 데이터베이스가 있다고 기대했다
를 원하는 것을 명확하게 설명합니다. 스팸 발송자가 모든 이메일 주소를 똑같이 스팸한다고 가정하기 때문에 베이 즈식 스팸 필터를이 데이터베이스에 미리 채워서 사용자 교육없이 대부분의 스팸을 캡처하여 시작하는 응용 프로그램을 만들 수 있습니다. 의견에 따라
저는 텍스트 블록을 스팸으로 분류 할 수있는 데이터베이스가 더 필요합니다. Akismet (워드 프레스 플러그인)은 예를 들어 모든 댓글을 스팸으로 분류 할 수 있습니다. –
Jon이 말한 것처럼 데이터베이스는 분류에별로 유용하지 않습니다. Akismet은 데이터베이스에 대해 확인하는 대신 스팸을 만드는 데 사용되는 절차 생성을 모방합니다. – JoshJordan
링크를 제공해 주셔서 감사합니다. 스팸을 분류하기위한 많은 알고리즘이 있지만 스팸 시그니처의 훌륭한 데이터베이스는 매우 가치가 있습니다. Wordpress 나 Google 같은 누군가 무료 데이터베이스로 스팸 서명을 게시하기를 바랬습니다. 아마, 나는 알고있다. 하지만 사람이 꿈꿀 수 있니? –