2012-12-31 2 views
0

전체 텍스트 검색 엔진으로서 SOLR에 관해서는 XML 문서에 대한 지원 문서를 찾고 있습니다. [1] XPath에서 어떤 지원이 있습니까 (XPath 개념을 사용하여 "필드"에 관해 묻는 관점에서)? [2] XQuery 쿼리에서 지원됩니까? [3] 계층 구조를 지원합니까? 예를 들어, 나는 다음과 같은 XMLSOLR (lucene) XML 지원

<A> 
    <B>kdflsdk</B> 
    <C> 
    <B>222</B> 
    </C> 
</A> 

나는 B 요소의 한계에 kdflsdk에 C 태그, 또는 쿼리 안에있는 (222)에 조회 할 수있는 방법이있어 가정하면?

답변

0

DIH for XML을 사용하여 데이터의 색인을 생성하고 Solr을 사용하여 필드를 검색 할 수 있습니다.

1

XML 문서에 대한 지원 문서를 찾고 있습니다.

당신은 [1] 임의의 XML 문서와 XML 문서의 DIH XPathEntityProcessor [2] 배치에 대한 색인을 처리하기 위해 XsltUpdateRequestHandler를 사용하는 것이 더 낫다. 이 두 기술 모두 잘 문서화되어 있습니다. 우선 wiki 페이지는 즉각적인 필요성을 충족시켜야합니다.

(XPath 개념을 사용하여 "필드"에 관해 묻는 관점에서) XPath에 대한 지원이 있습니까? XQuery 쿼리를 지원합니까?

Solr 색인 생성 방법 [3]의 기초를 파고 싶지만 기본적으로 Solr 색인으로 문서를 처리하면 Solr이 검색 가능하게 만듭니다. 그것이 Solr이 특정 취향 형식을 갖는 이유입니다 [4]. 색인을 생성하면 소스 파일의 구조를 잊어 버릴 수 있습니다.

계층 구조를 지원합니까? 예를 들어, XML을 사용하여 을 다음과 같이 가정합니다.

Solr는 암시 적으로 이것을 처리합니다. 데이터를 인덱싱 할 때 'Solr'이라고 생각하십시오. 일단 데이터를 인덱싱하면 Solr API를 사용하여 쿼리를 실행합니다.

는 B 요소의 한계에 kdflsdk에 C 태그, 또는 쿼리 안에 내가 222에 쿼리 할 수있는 방법은 무엇입니까?

몇 가지 여기서주의해야 할 :
1. 당신은 SOLR 인덱스로 섭취하는 동안 XML 파일 형식을 평평하게
2. SOLR는 HTTP 요청을 수락하고 그래서 당신은 아마 당신 때문에 몇 가지 다른 이름으로 /A/B/C/B 이름을 바꿀 것 이미 두 번째 수준 B 태그가 다음 machies 'kdflsdk가'....

http://localhost:8983/solr/select?q=B:kdflsdk&fl=CB

당신이 읽기해야 번째 수준의 B 태그의 값을 얻기 위해 아래와 같은 HTTP 요청을 발행 [5] Solr을 쿼리하는 방법을 이해하는 방법 .

[1] http://wiki.apache.org/solr/XsltUpdateRequestHandler
[2] http://wiki.apache.org/solr/DataImportHandler#XPathEntityProcessor
[3] http://www.solrtutorial.com/solr-in-5-minutes.html
[4] http://wiki.apache.org/solr/UpdateXmlMessages
[5] http://wiki.apache.org/solr/SolrQuerySyntax