Windows 컴퓨터에서 solrcloud-4.3.0 및 zookeeper-3.4.5를 사용하고 있습니다. 고유 필드 "id"가있는 색인 모음이 있습니다. 동일한 고유 ID 값을 가진 색인에 중복 문서가 있음을 확인했습니다. 내 이해에 따라 고유 한 필드의 목적이 그러한 상황을 피하는 것이기 때문에 발생하지 않아야합니다. 누구든지이 문제를 일으키는 원인이 될 수 있습니까?ID 필드가있는 Solrcloud 중복 문서
1
A
답변
0
"/conf/schema.xml"파일에는 기본적으로 "id"인 것으로 보이는 ""라는 XML 요소가 있습니다.이 요소는 "키"가되어야합니다.
그러나 Solr 설명서 (http://wiki.apache.org/solr/UniqueKey#Use_cases_which_do_not_require_a_unique_key)에 따르면 기존 색인에 새 문서를 점진적으로 추가 할 필요가없는 경우 항상 "고유 키"를 가질 필요는 없습니다. 당신의 상황에서 일어나고 있습니다. 그러나 나는 또한 항상 고유 ID가 필요하다는 인상을 받았다.
0
아마도이 질문에 대한 답변을 추가하기에는 너무 늦었지만 중복 된 문서/필드와 색인을 병합하여 고유 키/필드가있는 문서를 복제 할 수도 있습니다.
분명히 색인이 lucene IndexMergeTool 또는 solr CoreAdminHandler를 통해 병합 될 때 모든 중복 문서가 행복하게 색인에 추가됩니다. (lucene 및 solr 4.6.0 기준)
검색시 중복 제거가 발생하는 것 같습니다.
https://cwiki.apache.org/confluence/display/solr/Merging+Indexes
관련 문제
- 1. SolrCloud 문서 삽입/업데이트
- 2. Solr suggester : 분산 검색 (solrcloud) 중복 결과
- 3. null 필드가있는 Lucene 문서 컨테이너
- 4. 계산 된 필드가있는 응답 문서
- 5. Lucene - 특정 필드가있는 문서 필터링
- 6. 중복 ID
- 7. 문서 ID
- 8. SolrCloud 별칭을 나열하는 방법? SolrCloud 컬렉션 API에서
- 9. 중복 된 몽구스 문서
- 10. C# 재귀 중복 ID
- 11. PHP를 사용하여 중복 필드가있는 데이터베이스 업데이트
- 12. JBOSS의 SOLRCloud
- 13. 중복 필드가있는 행을 찾으십시오. 파일 형식이 blob입니다.
- 14. mongodb-C# 고유 한 필드가있는 문서 작성
- 15. mysql은 여러 필드가있는 중복 레코드를 방지합니다
- 16. 문서 라이브러리 중복
- 17. lucene.net 색인의 중복 문서
- 18. 고유 키가 같은 중복 문서
- 19. Python 중복 필드가있는 dict 항목 제거
- 20. 중복 된 필드가있는 결과를 반환하는 mySQL 쿼리?
- 21. Solrcloud 컬렉션 수집 버그?
- 22. ElasticSearch : 여러 개의 동일한 필드가있는 문서 찾기
- 23. 사용자 정의 필드가있는 문서 라이브러리 이동
- 24. 특정 빈 필드가있는 Solr의 모든 문서 삭제
- 25. ID 중복 방지
- 26. MySQL 중복 ID
- 27. 중복 ID mongodb
- 28. 중복 ID 레이아웃 오류
- 29. 자바 스크립트 중복 ID
- 30. GCM의 등록 ID 중복