비슷한 키워드 세트로 구문이나 키워드를 일치시켜야하는 프로젝트를 진행하고 있습니다. 나는 같은 의미 론적 분석을 수행 할 필요가있다.유사한 의미 또는 의미를 가진 구와 일치시키는 데 사용할 NLP 도구
예 :
관련 QT
싼 건강 보험
저렴한 건강 보험 적은
저렴한 건강 보험
공통의 의미에 대한
저렴한 비용으로 의료 보험
건강 보험
저렴한 의료 보험
여기에서 일반적인 의미 열의 단어는 관련 QT 열 아래 일치해야합니다. 나는 똑같은 일을 할 수있는 많은 도구와 기술을 보았다. S-Match는 매우 유망한 것처럼 보였지만 Java가 아닌 Python으로 작업해야합니다. 또한 잠복 성 시맨틱 분석은 좋아 보이지만 나는 키워드 매칭보다는 키워드 기반의 문서 분류에 대해 더 많이 생각한다고 생각합니다. 나는 NLTK에 다소 익숙하다. 누군가 내가 어떤 방향으로 나아가 야하고 어떤 도구를 사용해야하는지에 대한 통찰력을 줄 수 있습니까?
프로젝트의 범위는 어디까지입니까에서 파이썬 구현 - http://clic.cimec.unitn.it/composes/toolkit/installation.html
약 200000 단어의 그룹에서 저가의 건강 보험과 같은 의미 론적으로 유사한 단어를 추출해야합니다. 나는 클러스터에서 의미 론적으로 유사한 단어를 일치시킬 센터 (단어)를 생성하기 위해 이러한 단어에 초기 알고리즘을 실행 한 후에 클러스터링을 적용해야한다고 생각합니다. 모든 절차는 감독되지 않습니다. –