2010-02-03 5 views
3

나는 Lucene에서 많은 양의 데이터를 가지고있는 프로젝트에서 일하고있다. 우리는 패싯 검색을 보여줄 필요가 있으며, 정기적 인 Lucene 액세스를 사용하여 시뮬레이션을 시도 할 때 요구되는 시간이 용납 될 수 없습니다.Solr/Lucene과 매우 기본적인 친구

나는 SOLR에 대해 읽고,하지만 튜토리얼이 기본 점에 대해 매우 명확하지 않다 :

이 SOLR와 루씬을 사용하여 동일한 방법으로 저장된 데이터인가? Solen을 사용하여 Lucene과 함께 저장 한 데이터에 액세스 할 수 있습니까, 아니면 데이터 이전을해야합니까?

+1

쿼리 시간을 "용인 할 수없는"것으로 생각한 적이 있습니까? "많은 양의 데이터"를 어떻게 정의합니까? 예를 들어, 거의 모든 TB의 데이터를 아무런 문제없이 Lucene 색인에 직접 쿼리합니다. 큰 인덱스를 쿼리하는 최상의 방법을 조사해야합니다. 결론 : Solr은 훌륭하고 많은 기능을 즉시 사용할 수 있지만, 그 트레이드 오프를 고려해야합니다. – Mikos

답변

2

Solr은 기본적으로 lucene 기능을 감싸는 래퍼 (wrapper)로, 관리 인터페이스를 제공하는 것과 같이 조금 더 쉬워졌습니다. Solr을 사용하는 경우 lucene 검색 엔진을 사용하는 것이 좋습니다.

자세한 정보 here.

8

예, Solr 인스턴스에서 동일한 Lucene 인덱스를 사용할 수 있습니다. 인덱스에있는 필드와 일치하는 schema.xml 만 작성하면됩니다. 직접 SOLR에서 데이터가 사라 때문에 데이터를 인덱싱 할 수없는 것처럼 당신은 특별한 이유가없는 한 마우가 강조하는 방식을 루씬을 사용할 수 있지만 당신은 단지에 오르막 수영 것 같은

+1

동일한 Lucene 버전을 사용해야합니까? 그렇지 않으면 색인 읽기에서 호환성 오류가 발생합니다. –

+1

예, 비록 Solr 1.4가 몇 가지 자동 인덱스 업그레이드를 수행하지만, 나는 그것이 얼마나 멀리 갈 수 있는지 알지 못합니다. –

+0

lucene.net은 lucene과 동일한 색인을 생성합니까? – Krunal

2

후 느낌 Solr에 색인을 넣으십시오 ...

그리고 어느 시점에서 데이터를 다시 색인해야 할 가능성이 높으므로 Solr이 제공하는 더 나은 색인 옵션을 사용하는 방법을 알아 내면 더 오랜 시간을 절약 할 수 있습니다.