1
Term 개체에서 문서 집합을 얻는 방법을 알고 있지만 다른 방법으로 Document 개체에서 용어/용어 빈도를 구할 수 있습니까?Java Lucene Document 개체에서 용어 얻기
Term 개체에서 문서 집합을 얻는 방법을 알고 있지만 다른 방법으로 Document 개체에서 용어/용어 빈도를 구할 수 있습니까?Java Lucene Document 개체에서 용어 얻기
예, 문서에서 용어를 가져올 수는 있지만 쉬운 API는 없습니다. IndexReader에는 문서의 용어를 검색 할 수있는 getTermFreqVector 메서드가 있습니다. 사용자 지정 TermVectorMapper을 작성하여 전달해야합니다. getTermFreqVector().
사용자 지정 TVMapper에서 용어 및 해당 빈도는 map()
방법으로 수집됩니다. getTermFreqVector()
이 반환되면 사용자 지정 TVMapper에서 용어를 검색 할 수 있습니다.
불행히도 이것에 대한 과제는 API를 사용하지 않는 정말로 정말로 오래된 lucene 버전을 사용해야한다는 것입니다 ... 어쨌든 ... 고맙습니다.이 정보를 내 자신의 해시 테이블이나 승/전자에 저장해야합니다. – user623879