2010-04-13 6 views
1

정보 검색 시스템 (예 : Lucene)이 신속한 "관련성"조회를 위해 색인을 저장하는 방법에 대한 문서를 찾고 있습니다. 내 Google-fu가 실패했습니다. Lucene의 파일 형식을 설명하는 페이지를 찾았지 만, 신속한 쿼리를 작성하는 데 데이터베이스가 사용되는 방법보다 각 비트의 개수가 더 많은 것에 중점을 둡니다.정보 검색 데이터베이스 형식?

확실히 누군가 나를 추천 할 수있는 유용한 북마크가 있습니다.

감사합니다.

답변

2

루씬 지수 역 인덱스, 그래서이 주제에 대한 모든 검색이 같은 관련성이 있어야입니다 :

+0

사실은, 그것이 역 색인하지만 경우 I 10 개항의 질의어를 가지고 있고, 반전 된 색인에서 각 용어를 실제로 찾아보고, 결과를 교차시키고, 순위를 매기는 lucene입니까? – jemfinch

+0

본질적으로, 그렇습니다. Lucene 점수 계산 공식 (http://lucene.apache.org/java/3_0_1/api/all/org/apache/lucene/search/Similarity.html)을 보면 각 검색어는 색인을 검색하는 데 사용되는 벡터를 작성하는 데 사용됩니다. –