2013-07-10 2 views
1

Windows 컴퓨터에서 solrcloud-4.3.0 및 zookeeper-3.4.5를 사용하고 있습니다. 고유 필드 "id"가있는 색인 모음이 있습니다. 동일한 고유 ID 값을 가진 색인에 중복 문서가 있음을 확인했습니다. 내 이해에 따라 고유 한 필드의 목적이 그러한 상황을 피하는 것이기 때문에 발생하지 않아야합니다. 누구든지이 문제를 일으키는 원인이 될 수 있습니까?ID 필드가있는 Solrcloud 중복 문서

답변

0

"/conf/schema.xml"파일에는 기본적으로 "id"인 것으로 보이는 ""라는 XML 요소가 있습니다.이 요소는 "키"가되어야합니다.

그러나 Solr 설명서 (http://wiki.apache.org/solr/UniqueKey#Use_cases_which_do_not_require_a_unique_key)에 따르면 기존 색인에 새 문서를 점진적으로 추가 할 필요가없는 경우 항상 "고유 키"를 가질 필요는 없습니다. 당신의 상황에서 일어나고 있습니다. 그러나 나는 또한 항상 고유 ID가 필요하다는 인상을 받았다.

0

아마도이 질문에 대한 답변을 추가하기에는 너무 늦었지만 중복 된 문서/필드와 색인을 병합하여 고유 키/필드가있는 문서를 복제 할 수도 있습니다.

분명히 색인이 lucene IndexMergeTool 또는 solr CoreAdminHandler를 통해 병합 될 때 모든 중복 문서가 행복하게 색인에 추가됩니다. (lucene 및 solr 4.6.0 기준)

검색시 중복 제거가 발생하는 것 같습니다.

https://cwiki.apache.org/confluence/display/solr/Merging+Indexes