2017-11-25 1 views
0

저는 Solr이 Lucene을 사용하고 Lucene이 역 색인을 사용한다는 것을 알고 있습니다. 그러나 제가 지금까지 본 Lucene 예제에서 Solr과 어떻게 조합되었는지 이해할 수 있을지 확신하지 못합니다. Solr은 어떻게 문서를 저장합니까

은 다음 문서를 감안할 때 : 내가 지금까지 본 예제에서

<doc> 
    <field name="id">9885A004</field> 
    <field name="name">Canon PowerShot SD500</field> 
    <field name="manu">Canon Inc.</field> 
    <field name="inStock">true</field> 
</doc> 

을, 나는 루씬 문서로 각 필드를 치료해야한다고 생각합니다. 그러면 ord 대포가 name 필드와 manu 필드에 나타납니다.

색인이 많이 나뉘어 집니까? 또는 색인은 "캐논이라는 단어가 이드와 같은 문서에 나타납니다"라고 말하고 있습니까?

Lucene을 Solr과 함께 사용하면 정확히 어떻게 작동합니까? 색인에서이 문서의 모양은 어떻게됩니까? (각 필드에 indexed="true"이 있다고 가정)

+1

할 수 있습니다 ([2013 년 루씬/SOLR 혁명에서 프리젠 테이션 중 하나를 통해 방법 루씬 저장 데이터에 대한 자세한 개요]을 얻을 https://www.slideshare.net/lucenerevolution/what - isaluceneagrandfinal). DocValues는 특정 작업의 속도를 높이는 규칙적인 역 색인과 달리 열 기반의 저장소라는 점에 대해서는 확실하지 않습니다. – MatsLindh

+0

@MatsLindh 정보를 제공해 주셔서 감사합니다! – user3813234

답변

1

몇 년 전에 블로그 게시물을 작성하여 자세히 설명했습니다 [1].

짧은이 질문에 대한 대답 : ". 내가 지금까지 본 예제에서, 나는 루씬 문서로 각 필드를 치료해야한다는 생각"

절대적으로 아닙니다. Lucene 정보 단위는 map 필드 -> value [s]로 구성된 문서입니다. Solr 문서는 필드가 설명 된 스키마를 통합 한 Solr과 약간 다른 표현입니다. 그래서 Solen에서는 유형 및 기타 속성 (스키마에 저장되어 있음)을 설명 할 필요없이 필드에 문서를 추가 할 수 있으며 Lucene에서는 문서를 만들 때 명시 적으로 정의해야합니다.

[1] https://sease.io/2015/07/26/exploring-solr-internals-the-lucene-inverted-index/

관련 문제