2011-02-28 2 views
0

나는 방금 1 totalHits에서 보았고 scoreHits는 쿼리의 히트 수와 총 히트 수를 각각 반환합니다.Lucene : 쿼리의 조회수는 얼마나 되나요?

정확히 "히트"는 무엇을 의미합니까? 문서에서 검색된 용어의 위치 또는 용어가 포함 된 문서 ... 또는 무엇입니까?

감사

답변

1

totalHits 쿼리를 일치하는 문서의 수입니다. 기본적으로 히트는 입력 한 쿼리와 일치합니다. 그러나 히트는 부분 일치 또는 전체 일치 일 수 있습니다.

우리는 3 텍스트의 집합에 인덱스 루씬을 사용하는 경우 : 안녕하세요 세계

총 조회수 : 2

1.078 인사를 { "안녕하세요", "안녕하세요 선원", "잘자 달"}, 다음 검색 세계

0.181 안녕하세요 선원

는 float 값은 쿼리 문자열에 관련되는 히트에 대한 점수를 나타냅니다.

다음 포스트는 http://lingpipe-blog.com/2009/02/18/lucene-24-in-60-seconds/

+0

가 좋아, 그러나 totalHits 여전히 약간 혼란 자세한 정보를 제공합니다. 상위 관련 문서 인 TopDocs 클래스의 메서드입니다 (필자의 경우 20 워드로 제한을 설정했습니다.) TopDocs docs = searcher.search (query, 20); 그래서 totalHits는 항상 20 여야합니다. ?! – aneuryzm

+0

@Patrick, totalHits는 20 개의 실제 히트가있을 경우에만 20 개가됩니다. 실제 일치가 20 개 이상인 경우 총 히트를 20 개로 제한하십시오. – Paul