2016-09-15 5 views
2

fb2 형식의 책을 나타내는 일부 라이브러리의 인덱싱에 Solr을 사용하고 싶습니다. 실제로 fb2는 단지 xsd format 인 xml입니다. 는하지만, post.jar *이 .fb2 파일을 무시하고 내가 좋아하는, 인덱스 필드에 FB2 파일의 값을 매핑하는 방법을 이해 해달라고 :Solr : fb2 파일 인덱싱

<book-title>some book</book-title> 

... 인덱스에서 "책 제목"필드에. 플러그인 또는 다른 것을 만들어야합니까?

답변

3

Solr Data Import Handler (DIH)를 살펴보아야합니다. SOLR의 예에서

https://cwiki.apache.org/confluence/display/solr/Uploading+Structured+Data+Store+Data+with+the+Data+Import+Handler

는 당신이 RSS 가져 오기의 예를 폴더. http://www.andornot.com/blog/post/Sample-Solr-DataImportHandler-for-XML-Files.aspx

:

여기

좀 더 정보입니다 : 당신은 RSS 데이터-config.xml 파일을 보면 당신은 예를 들어, SOLR 필드에 XML에서 매핑 할 XPathEntityProcessor를 사용하는 방법을 볼 수 있습니다

특정 파일 형식으로 작업하기 위해 Tika 파서를 작성했습니다. 당신이 당신이 좋아하는 프로그래밍 언어를 사용하여 파일을 읽고 API를 사용하여 SOLR에 데이터를 보낼 수 있습니다 더 유연성을

https://lucidworks.com/blog/2010/06/18/extending-apache-tika-capabilities/

. 우리는 DIH가 우리가 달성하기를 원하는만큼 융통성이 없었기 때문에 최근의 신청을 위해이 작업을 수행해야했습니다.