2011-03-10 9 views
2

Lucene은 점진적 색인 기능이 뛰어납니다. 이것은 처음부터 정보 검색 시스템을 개발할 때 일반적으로 고통 스럽습니다. 낮은 수준의 Lucene API를 사용하여 반전 된 목록, 위치 정보, 용어 빈도, idfs, 필드 저장소 등의 반전 된 색인으로 만 사용할 수 있는지 알고 싶습니다.Lucene을 거꾸로 된 색인으로 사용

최종선은 내 자신의 가중치와 문서 채점을 구현하려고한다는 것입니다. 나는 Similarity 클래스를 알고 있지만, 원하는 유연성을주지 못합니다.

답변

1

확실히 자신 만의 쿼리 클래스와 자신의 스코어러 등을 만들 수 있습니다. 글로벌 데이터가 필요한 경우에만 문제가 발생할 수 있습니다. 예를 들어, freq와 inverse doc freq라는 용어가 필요합니다.) 득점 알고리즘에 필요한 다른 교차 문서 또는 교차 메타 데이터가있는 경우 문제가 될 수 있습니다. 내가 이것을 저장하는 방법을 잘 알고있다.

하지만 기본적으로 알고리즘이 막연하게 tf/idf이거나 문서 당 작동하는 한 당신은 괜찮을 것이라고 생각합니다.

관련 문제