2012-04-04 3 views
0

나는 많은 사이트를 크롤링했습니다. Solr 3.4를 사용하여 결과를 찾아 보았으나 도메인별로 결과를 그룹화했습니다. 예를 들어 'tabnak'을 검색하면 첫 번째 검색 결과에는 'http://tabnak.ir'만 포함되며 해당 도메인의 다른 검색 결과는 표시되지 않습니다 (예 : google).solr에서 도메인별로 결과를 그룹화하는 방법은 무엇입니까?

나는 다음과 같은 결과를 무시하려는

:

http://tabnak.ir/en/news/1020/title 
http://tabnak.ir/fa/allnews 
... 

가 어떻게 그룹, group.field과와 SOLR에 대한 쿼리를 만들 수 있습니다 ...?

감사

+0

무엇을 의미합니까? – hadi

+0

내가 아는 한, SOLR은 도메인에 대해 알지 못합니다. 그것은 단지 문자열입니다. 게다가, 나는 그 질문이 아주 잘 설명되지 않았다고 생각한다. 조금 더 연마해라. –

답변

0

당신은 별도의 인덱스 필드를 생성해야하고 URL에서 도메인을 분리 할 때 SOLR 인덱스는 데이터를 확인해야합니다 (이 경우 '도메인'라는 이름의 예를 들면).

그런 다음 필드 축소 그룹을 검색 결과에 적용해야합니다. 참고 : http://wiki.apache.org/solr/FieldCollapsing

관련 문제