Lucene (또는보다 구체적으로 Compass)을 사용하여 포럼에 스레드를 기록하고 토론 뒤에 키워드를 추출 할 방법이 필요합니다. 즉, 누군가가 만드는 모든 항목을 색인화하고 싶지는 않지만 특정 컨텍스트와 관련이있는 '키워드'목록을 가지며 항목이 키워드와 일치하고 임계 값 이상인 경우 인덱스에 대한 이러한 항목.인덱싱하지 않고 lucene 토큰 쿼리
나는 분석기의 힘을 사용하여 물건을 벗겨 내고 마술을 할 수 있기를 원하지만 키워드와 일치시키기 위해 분석기에서 토큰을 반환하고 특정 단어가 나오는 횟수를 계산합니다. 언급되고있다.
모든 항목의 색인 생성에 오버 헤드가 발생하지 않고 분석기에서 토큰을 얻을 수있는 방법이 있습니까?
나는 모든 항목을 저장하고 내 키워드 목록을 사용하여 검색을 수행 한 다음 해당 문서를 지속성 관리자와 병합하여 실제로 관련 항목을 저장하도록 RAMDirectory를 유지해야한다고 생각했습니다.
아래 답변 중 어떤 것이 좋을지 ... 비슷한 문제가 있습니다. – andy