2011-08-17 4 views
0

나는 매우 기본적인 결과 순위 알고리즘을 만들고 있는데, 한 가지는 주어진 단어에서 어떤 단어가 일반적으로 더 중요한지 결정하는 방법이다. 그것은 정확하고, 일반적 일 필요는 없습니다.단어 가중치를위한 출처는?

분명히 단어를 4 자 이하로 삭제하고 이름을 식별합니다. 그러나 다른 어떤 방법으로 문장에서 가장 중요한 단어 3 개를 골라 낼 수 있습니까?

+0

가의 순위는 무엇입니까? 검색 엔진? –

답변

0

다른 정보가 없으면 중요한 단어는 드문 단어라고 가정하는 것이 합리적입니다. 각 단어가 문서 세트에 몇 번 나타날지 계산하십시오. 가장 낮은 카운트를 가진 단어가 더 중요하며, 가장 높은 카운트를 가진 단어는 덜 중요하지 않습니다 (거의 쓸모 없다면).

관련 독서 :

관련 문제