2011-01-26 2 views
1

내가 다른 소스에서 분석 아파치 루씬을 사용하여 웹 페이지의 콘텐츠의 그룹을 평가하는 시스템에서 일하고 있어요의 첫 번째 항목에 지금 직면하고있는 문제가 무엇인지 메신저를 추가 부스트를 추가 그 결과, 소스가 더 나은 가중치를 갖는 페이지가 1 개 이상있을 때 항상 같은 소스에서 온 페이지 그룹이 먼저 표시됩니다.루씬은</p> <p>, 용어

나는 결과를 더 세분화하기 위해 lucene 옵션을 사용할 수 있으므로 소스의 첫 번째 항목 만 나열되고 나머지는 결과 목록의 끝까지 끌리므로 최소한 user 처음 몇 페이지에서 동일한 출처의 전체 컨텐츠 목록을 보는 대신 다른 출처의 다른 결과를 먼저 볼 수 있습니다 ....

답변

2

Solr의 최신 (출간되지 않은 버전) Lucene)에는 field/result collapsing이라는 기능이 있습니다.이 기능은 필드 값을 기반으로 결과를 그룹화합니다.

http://wiki.apache.org/solr/FieldCollapsing

당신이 SOLR를 사용하지 않으려면, 당신은해야이 결과 집합을 반복하고 재정렬하여 직접 구현하는 것이 기반이처럼 보이는 당신이 찾고있는 무엇 당신의 기준. 이 기능을 충분히 수행하려면 "소스"필드에 FieldCache를 사용해야합니다.

+0

감사합니다. 나는 이것을 조사하여 내가 무엇을 할 수 있는지보고, 귀하의 피드백에 대해 높이 평가합니다. – jiun