2009-03-20 5 views
0

CMS에서 실행중인 내 웹 사이트에 블로깅 기능을 만들고 있습니다.내 블로그웨어에 태그 제안 기능을 추가하는 방법은 무엇입니까?

사람이 기사를 작성했습니다

이, 그는이 자동으로 '제안 태그'와 함께 제공해야합니다

내 요구 사항이 있습니다. 이 단어는 기사에서 나와야합니다. 이 기능을 어떻게 구현할 수 있습니까?

몇 가지 아이디어를 생각했습니다. Like :

  1. 가장 긴 단어를 제안하십시오. 이것을 사용하여 'a', 'of', 'my'등을 필터링 할 수 있지만 'because'는 필터링 할 수 없습니다.
  2. 단어의 블랙리스트를 만듭니다. 그러나 나는 그런 기성품 목록을 발견 할 수 없었고 그런 목록을 만드는 것은 오랜 시간이 걸릴 것이다.

그래서 다른 아이디어가 있습니까?

답변

0

Bayesian classification을 수행하고 어떤 결과가 발생하는지 볼 수 있습니다. 여기에 example code이 있습니다.

업데이트 : 이것은 분류 기준에 선택할 수있는 태그가 있음을 전제로합니다. 태그 목록을 초기화해야하는 경우 텍스트에서 키워드를 추출하는 데 여기에 simple algorithm이 있습니다.

관련 문제