2011-12-13 4 views
0

우리는 Solr 1.4를 사용하여 사용자 쿼리 결과를 산출합니다. 결과는 대략 500,000 개의 문서가 포함 된 색인에서 가져옵니다. 새 문서와 오래된 문서가 만료되면서 색인이 지속적으로 업데이트됩니다.관련성별로 득점 solr 결과 및 카테고리

결과 페이지는 관련성 (점수)별로 정렬 된 문서 목록으로, 사용자 쿼리에 따라 자동으로 계산됩니다. 각 문서는 단일 카테고리 (예 : 엔지니어링, 금융, 관리, 수학 등)에 속하며 카테고리 ID는 Solr에 의해 저장되고 색인됩니다.

우리가 달성하고자하는 것은 관련성에 따라 문서를 정렬하는 것이지만 결과의 첫 번째 페이지 (10,20 또는 50)에 가능한 한 많은 범주의 문서가 포함되도록 어떤 방식 으로든 가중치를 적용해야합니다. 동일한 카테고리의 문서가 거의 연속되지 않습니다.

Google은 많은 부분을 검색했지만 실현 가능한 시나리오를 찾아 내지 못했습니다.

아이디어에 대해 미리 감사드립니다. GK

답변

1

내가 아는 한 Solr에서는이를 수행 할 수 없습니다. 검색 용어가 다른 어떤 것보다 엔지니어링 항목에 훨씬 더 많이 적용될 수 있다면 검색 결과를 기반으로 다른 카테고리를 인위적으로 다른 방식으로 향상시켜야 할 것입니다.

field collapsing을 사용하여 최신 버전에서 이와 비슷한 작업을 수행 할 수 있습니다. 나는. 당신은 범주에서 X 개의 히트 수를 얻고 '에 대한 링크는과 유사합니다.'와 같은 링크가 표시됩니다.

또는 각 범주마다 하나씩 여러 가지 검색을 수행 할 수 있습니다.