2
디렉토리의 모든 pdf/doc 파일을 스캔하려고합니다. 이것은 잘 작동하고 모든 문서를 스캔 할 수 있습니다.Solr의 FileListEntityProcessor를 사용하여 검색 결과에 파일 이름을 표시하는 방법
내가하려고하는 다음 작업은 검색 결과에서 파일 이름을받는 것입니다. 그러나 파일 이름은 표시되지 않습니다. 나는 두 가지 시도를했지만, 문서는 이것을하는 방법에 대해별로 도움이되지 않습니다.
: 아파치-SOLR-3.1.0/예/예 - 다이 하이드로/SOLR/티카/conf의이 내 dataConfig된다
나는 SOLR 배포에있는 SOLR 구성을 사용하고 있습니다
<dataConfig>
<dataSource type="BinFileDataSource" name="bin"/>
<document>
<entity name="f" processor="FileListEntityProcessor" recursive="true"
rootEntity="false" dataSource="null" baseDir="C:/solrtestsmall"
fileName=".*\.(DOC)|(PDF)|(pdf)|(doc)" onError="skip">
<entity name="tika-test" processor="TikaEntityProcessor"
url="${f.fileAbsolutePath}" format="text" dataSource="bin"
onError="skip">
<field column="Author" name="author" meta="true"/>
<field column="title" name="title" meta="true"/>
<field column="text" name="text"/>
</entity>
<field column="fileName" name="fileName"/>
</entity>
</document>
</dataConfig>
올바르게 구성하는 방법과 특정 문서를 찾을 수있는 다른 장소에도 관심이 있습니다.