String을 취할 수 있고 키워드/keyphrases 인 Strings 세트를 리턴 할 수있는 사용하기 쉬운 Java 라이브러리가 있습니까?java 키워드 추출
특별히 똑똑 할 필요는 없으며, 키워드를 일치시키기 위해 스톱 단어와 형태소 분석을 사용하십시오.
나는 KEA 패키지 http://code.google.com/p/kea-algorithm/을보고 있지만 코드를 사용하는 방법을 알 수는 없습니다.
간단한 예제 문서가있는 간단한 것이 이상적 일 것입니다. 그 동안 나는이 글을 쓰는 것에 대해 이야기 할 것이다!
편집 : 코드를 사용하는 방법을 파악하는 방법을 알 수 없다고 할 때, 나는 간단한 방법을 볼 수 없다는 것을 의미합니다. 개개의 수업은 그 자체로 많은 일을 할 수있는 유용한 방법을 가지고 있습니다.
당신은 키워드/핵심 문구를 무엇을 의미합니까? 문자열이나 뭔가 안에 정규식처럼? –
no .... 검색 엔진이 인식 할 수있는 키워드로, 뉴스 기사에서 키워드를 추출하고 다른 뉴스 사이트에서 유사한 기사 목록을 얻고 싶습니다. (기존 서비스가 많이 있다는 것을 알고 있습니다. 약간의 재미와 나를 위해 배우는). – Ankur
좋은 생각이 듭니다. 단어/문구 빈도를 계산하는 알고리즘을 찾고 작성해야합니다. –