2012-07-05 4 views
1

엄청난 양의 내용을 매우 짧은 순서로 색인화해야합니다. Solrnet/solr을 사용하여 스레딩과 TPL을 사용하여 다양한 기법을 시도했지만 속도는 많이 필요합니다. 그러므로 Lucene.net 색인 작성자를 사용하여 색인을 만드는 방법을 생각해보십시오 (사전에 거의 속도 향상 정도를 보았습니다). 알고있는 모든 "잡았다"?Lucene을 사용하여 Solr 색인 만들기 IndexWriter

확실하지 않습니다. 1. Trie 기반 Numeric Range 쿼리는 Solr을 통해 쿼리에 계속 사용할 수 있습니다. (Lucene에서 NumericFields를 사용하고 있습니까?) 2. Faceting 등은 계속 사용할 수 있습니까?

내가주의해야 할 사항이 있습니까?

+0

아마도 Solr의 색인 생성 처리량을 향상시키기 위해해야 ​​할 일이 있습니다 ... 어떤 mergeFactor를 사용합니까? 얼마나 자주 저지른거야? 당신 ramBufferSizeMB 무엇입니까? – jpountz

답변

1

실행 시간 개선에 대해서는 Scaling Lucene and Solr을 참조하십시오.

당신이 루씬으로 이동하기로 결정하는 경우 :

  • 는 유효한 SOLR 인덱스로 인덱스에 대한 고유 ID 필드가 필요합니다.
  • 스키마가 Solr 스키마와 일치해야합니다.
  • Lucene 버전은 Solr과 같아야합니다.
  • Solr의 요구 사항에 따라 각 필드를 인덱싱하고 동일한 분석기를 사용하는 경우 범위 쿼리와 패싯을 사용할 수 있다고 생각합니다.
+0

감사합니다 Yuval, 내 도전 Lucene.net (따라서 2.9로 제한)를 사용하고 있습니다. Lucene에서 NumericField가 Solr에서 문제를 일으키는 것을 발견했습니다. – Mikos

+0

링크가 죽었습니다. – Neth

+1

안녕하세요, 님, 링크를 수정했습니다. –