2011-08-05 9 views
8

solr 인덱스를 최적화하는 방법. solrconfig.xml에서 색인을 생성하려고 변경하기 위해 solr 색인을 최적화하고 싶지만 색인 최적화에 어떤 것이 포함되는지 최적화 방법을 확인하고 싶습니다.solr 인덱스를 최적화하는 방법

답변

2

인덱스를 최적화하는 방법에는 여러 가지가 있습니다. 당신은 SOLR 기본 스크립트 중 하나를 실행할 수 있습니다 : 새로운 데이터를 추가하는 동안 당신은 또한 (전체) 수입에서 optimize=true을 설정하거나 할 수 http://wiki.apache.org/solr/SolrOperationsTools#optimize

. 당신이 색인을 최적화 할의 변화, 그냥 사용자 정의 인덱서를 작성하고 추가 얼마나 많은 테스트를 위해 http://wiki.apache.org/solr/UpdateXmlMessages#A.22commit.22_and_.22optimize.22

0

: ... 또는 단순히 아마이 귀하의 요구에 대한 흥미로운 일이 될 수있는이 optimize=true

와 커밋 트리거 무작위로 생성 된 콘텐츠. 많은 수의 문서 (500.000 또는 1.000.000)를 추가하고 소요 시간을 측정하십시오.

위에서 공유 한 기사를 따라 나 자신에게 맞춤식 인덱서를 만들었으며 문서를 색인화하는 데 걸리는 시간을 80 %까지 최적화했습니다.

13

이 방법이 Solr 색인을 최적화하는 가장 쉬운 방법이라고 생각합니다. 내 문맥에서 "최적화"는 모든 인덱스 세그먼트를 병합하는 것을 의미합니다.

curl http://localhost:8983/solr/<core_name>/update -F stream.body=' <optimize />' 
+1

은 그러나이 명령을 실행 한 후 모든 상태를 반환 doesnot. 그리고 내 관리 페이지에 어떤 변화가 보이지 않습니다. cmd가 막혔습니다. – Milee

7

시작하기 전에 각 코어의 크기를 확인하십시오.

열기 터미널 1 :

watch -n 10 "du -sh /path to core/data/*" 

열기 제 2 터미널 및 실행 :

대신 "핵심"의
curl http://hostname:8980/solr/<core>/update?optimize=true 

는, 코어의 당신의 각각의 이름을 업데이트합니다.

코어의 크기가 색인 된 데이터의 크기보다 약 두 배로 증가하고 갑자기 줄어드는 것을 볼 수 있습니다. 이것은 solr 데이터에 따라 시간이 걸릴 것입니다.

예를 들어, 50G 색인 데이터는 거의 90G에 달하고 최적화 된 25G 데이터는 감소합니다. 일반적으로이 양의 데이터에는 30-45 분이 소요됩니다.

Why doesn't my index directory get smaller (immediately) when i delete documents? force a merge? optimize?