문서가 n 개 있고이 문서에 포함 된 일반적인 단어를 찾고 싶습니다. 예를 들어 (n-3) 개의 문서에 "web"이라는 단어가 포함되어 있다고 말하고 싶습니다.n 개의 텍스트 문서 중에서 유사한 단어 검색
확실히 기본 데이터 구조로 할 수 있지만 효율적인 알고리즘이나 다른 접미사가있는 동일한 단어를 처리 할 수있는 방법이있을 수 있습니다. 그런 목적을위한 알고리즘이 있습니까?
데이터 검색에 익숙하지 않습니다. 일반적으로 서로 다른 문서간에 유사점을 찾는 데 사용되는 용어가 있습니까? 그렇다면 내 연구를 쉽게 할 것입니다.
감사합니다.