나는 solr 인덱스에 MySQL 데이터베이스를 추가하려고합니다. 데이터 가져 오기 프로세스가 끝나면 "1428760"문서가 업데이트됩니다. 하지만 완전한 검색 쿼리는 numFound="546195"
입니다.Solr : 잘못된 numFound 값
무엇이 문제입니까? 왜이 불일치?
나는 solr 인덱스에 MySQL 데이터베이스를 추가하려고합니다. 데이터 가져 오기 프로세스가 끝나면 "1428760"문서가 업데이트됩니다. 하지만 완전한 검색 쿼리는 numFound="546195"
입니다.Solr : 잘못된 numFound 값
무엇이 문제입니까? 왜이 불일치?
점검 :
http://lucene.472066.n3.nabble.com/Changing-value-of-start-parameter-affects-numFound-td2460645.html
어떤 사람은 SOLR에서 중복 문서에 대해 뭔가를 말한다. 문서를 다시 색인하기 전에 문서를 명시 적으로 제거해야하는 것처럼 보입니다.
나는 관리자 패널이나 CoreAdmin API와 같은 권위있는 곳에서 1,428,760 명이 왔는데 와일드 카드 검색과 일치하는 숫자는 546,195라고 생각합니다.
헤더를 확인하십시오. partialResults
플래그가 true로 설정되어 있습니까? 그렇다면 Solr은 색인을 통해 스캔 할 때 내부적으로 timeAllowed
시간 초과에 도달하고 모든 일치하는 문서의 부분 집합 만 반환했습니다.
이것은 Solr의 성능 선호도를 보여주는 하나의 기능입니다. 가능한 한 빨리 쿼리에 가장 관련성이 높은 결과를 제공하려고 시도합니다. 많은 문서가 쿼리와 일치 할 때 관련성에 영향을 미치지 않으면 서 시간을 절약하고 신속하게 반환 할 수 있다고 가정합니다. 누가 50 만 건의 히트작을 페이지 매김 할 것인가?
어쨌든 더 자세한 내용이 없으면 이는 단지 추측이며 partialResults
에 대한 간단한 설명 일뿐입니다. 여기
은 (는) 귀하의 독특한 기록입니까? 당 기본 ID로 ??? Solr은 같은 id로 레코드를 덮어 씁니다. – Jayendra
1428760 업데이트 된 문서를 보여주는 사람은 누구입니까? 업데이트를 완료 한 후 커밋 했습니까? –
jayendra 고맙습니다. 귀하의 요점은 정확합니다. 이제 모든 레코드에 대해 고유 한 키를 설정했습니다. 문제가 해결되었습니다. –