Lucene의 분석 기능은 모두 알고있는 것처럼 들립니다. 이 기능의 핵심은 Analyzer 클래스입니다. 문서에서 :
분석기는 텍스트를 분석하는 TokenStreams를 빌드합니다. 따라서 텍스트에서 색인 용어를 추출하는 정책을 나타냅니다.
이 선택할 수있는 많은 Analyzer
클래스가 있지만 StandardAnalyzer
은 일반적으로 좋은 일을 : 당신은 당신의 목적을 위해 더 나은 일을 할 것입니다 다른 분석기을 찾을 수
// For each chapter...
Reader reader = ...; // You are responsible for opening a reader for each chapter
Analyzer analyzer = new StandardAnalyzer();
TokenStream tokenStream = analyzer.tokenStream("", reader);
Token token = new Token();
while ((token = tokenStream.next(token)) != null)) {
String keyword = token.term();
// You can now do whatever you wish with this keyword
}
.
책 색인 색인을 만들려고하십니까? 이것은 일회성 실행입니까, 아니면 시간이 지남에 따라 색인을 검색합니까? 귀하가 의미하는 바를 간략히 예를 들어주십시오 (두 섹션, 각 키워드 당 두 개의 키워드, 필요한 입/출력). –