2013-06-25 2 views
0

사전 추출 후 키워드 추출 시스템에서 작업하고 있습니다. 동일한 패턴으로 일치하는 텍스트를 확인하여 후보 키워드를 추출합니다.어떻게 문자열 유사도를 찾을 수 있습니까?

이제 추출 된 후보 키워드 사이의 유사성을 찾는 방법을 알고 싶습니까?

 k1 k2 k3 

k1 1 ?1 ?2 

k2 ?1 1 ?3 

k3 ?2 ?3 1 


how can I find the values of (?) ??? 
where 
    (?1) refer to the sense similarity degree between (k1) and (k2) 
    (?2) refer to the sense similarity degree between (k1) and (k3) 
    (?3) refer to the sense similarity degree between (k2) and (k3) 

참고 : 예를 들어 은의 다음 행렬을 볼 수 있도록 키워드를 한 단어 나 될 수 있습니다 더

+0

에서 발견? 길이의 차이점은 무엇입니까? 문자? 한 단어에서 다른 단어로의 변화 수? –

+0

[Levenshtein distance] (http://en.wikipedia.org/wiki/Levenshtein_distance)에 대해 이야기하고 있습니까? – jerry

+0

단어 의미 유사성을 의미합니다 .... 의미의 유사성 정도 –

답변

0

당신은 체크 아웃 할 수 있습니다 워드 넷 :: 유사성 -이 단어의 감각 사이의 유사성의 조치를 제공합니다 당신이 유사성으로 자격이 무엇 워드 넷

http://wn-similarity.sourceforge.net

관련 문제