2012-10-30 3 views
0

동일한 전자 메일 주소로 내 SOLR 인덱싱에 2 개의 레코드가 있고 키워드 검색이 결과 집합에서 둘 다 얻는 경우 어떻게 그 중 하나를 표시 할 수 있습니까? 예를 들어;SOLR 검색 : 중복 전자 메일 주소 제거

기록 1 :

<doc> 
    <id>456</id> 
    <name>Adil Malik</name> 
    <email>[email protected]</email> 
    <jobtitile>Database Developer</jobtitle> 
</doc> 

우리가 "[email protected]",이 두 기록을 반환로 검색하면하지만 난 그들 중 하나를 표시하려면 :

<doc> 
    <id>123</id> 
    <name>Adil Malik</name> 
    <email>[email protected]</email> 
    <jobtitile>Software Engineer</jobtitle> 
</doc> 

기록 2 . 동일한 전자 메일 주소로 2 개가있을 경우 SOLR 검색에서 하나의 레코드 만 표시하도록 쿼리 할 수 ​​있습니까?

참고 : 두 레코드를 모두 내 SOLR 색인에 보관하고 싶습니다. 응답에서


는 고유 키로 이메일 필드를 사용하는 방법에 대한 그래서 중복이 허용되지 않습니다 어떻게

enter image description here

+0

색인 생성에 중복 기록을 남기고 싶습니다. Job Title : "Software Engineer"로 검색하거나 Job Title : "Database Developer"로 검색하는 경우 "Adil Malik"은 –

+0

을 반환해야합니다. 전자 메일과 같은 일반적인 필드 ([email protected])로 검색하는 경우, 이제 SOLR 검색은 id가 123과 456 인 2 개의 레코드를 반환합니다.이 경우에는 그 중 하나만 표시하려고합니다. –

답변

8

https://wiki.apache.org/solr/SchemaXml (중복 제거는 당신이 원하는하지 않은, 모든 인덱스에 들어가는 문서를 방지,하지만 난 ' 이것이 적합한 다른 독자를 돕기 위해 여기에 보관하십시오.).

당신은 당신이 실제로 무엇을 원하는 쿼리를 사용하지만 group: true , group.field : email

, 제공된 문서 예제를 찾고있다, 아마, 당신이 당신의 스키마가 잘못 설계 한 것을 말할 것 및 것의 FieldCollapsing을 사용하려면 다중 값 필드를 사용합니다.

여기서이 질문을 읽으십시오. 대신 MVF를 어떻게 사용했는지 설명하고 조언하십시오.

What is the use of "multiValued" field type in Solr?

+0

여러분의 jobtitle 필드에 multiValued 필드 유형을 사용합니다. –

+0

스키마에 관해서는 기본적으로 다중 값이 내 마음 속에 있지만 시스템 요구 사항 때문에 사용할 수 없다는 것을 디자인 할 때입니다. 이것은 매우 방대한 시스템이며 여기에서 설명 할 수없는 것들이 너무 많습니다. 모든 것을 처리하기 위해 다중 값을 사용하지 않았고 각 레코드를 SOLR 인덱싱에 별도로 보관했습니다. 나는 "FieldCollapsing"이 내가 필요한 정확한 것이라고 생각한다. 하지만 내가 시도했을 때 그것은 나를 위해 일하지 않습니다. 스크린 샷을 내 질문 본문에 첨부했습니다. 당신이 도울 수 있는지 한번보세요. 고마워요. –

+0

OK, fieldCollapsing가 수정되었습니다. 사실 내가 버전 2로 업그레이드하고 버전 4로 업그레이드해야했습니다. :) 고마워요. –

1

을 @Layke하는? 의 schema.xml에 대한 위키 페이지에 <uniqueKey>에 대한 검색 당신은 FieldCollapsing에 또한 Deduplication에 대한 몇 가지 독서를해야

+0

하지만 두 레코드를 모두 내 SOLR 인덱싱에 보관하려고합니다. –

+0

FieldCollapsing이 도움이 될 수 있습니다. https://wiki.apache.org/solr/FieldCollapsing –

관련 문제