2010-02-18 10 views
2

SOLR의 원격 스트리밍 기능을 사용하여 파일의 내용을 추출하고 색인화하려고합니다.SOLR의 원격 스트림 다중 파일

stream.file = xxx를 http GET 메서드의 매개 변수로 전달하면 정상적으로 작동합니다.

그러나 이러한 항목이 많아서 일괄 처리 (파일 당 GET이 필요 없음)하고 싶습니다.

SOLR에서 수행 할 수있는 방법이 있습니까?

<add> 
    <doc stream_file="filename"> 
    <field name="id">123</field> 
    </doc> 
    <doc>... 

답변

0

This has been recently asked을 (및 응답)을 SOLR 사용자 메일 링리스트에 :이 같은 일부 XML을 게시 할 수 있도록하고 싶습니다.

+0

이 링크는 이제 죽은 것으로 보입니다. 관련 링크 두 개를 찾았습니다. http://lucene.472066.n3.nabble.com/Extracting-and-indexing-content-from-multiple-binary-files-into-a-single-Solr-document-td1916693.html 및 http : //mail-archives.apache.org/mod_mbox/lucene-solr-user/201003.mbox/%[email protected]%3E – kolrie

0

일괄 처리 만 커밋하고 모든 추가 작업 후에 커밋하지 않으려면 여러 ADD가 빠르다는 것을 알았습니다. 나는 성능 페널티가 당신 자신의 RequestHandler를 작성할만한 가치가 없다고 생각할 것이다.