2011-05-13 5 views
2

디렉토리의 모든 pdf/doc 파일을 스캔하려고합니다. 이것은 잘 작동하고 모든 문서를 스캔 할 수 있습니다.Solr의 FileListEntityProcessor를 사용하여 검색 결과에 파일 이름을 표시하는 방법

내가하려고하는 다음 작업은 검색 결과에서 파일 이름을받는 것입니다. 그러나 파일 이름은 표시되지 않습니다. 나는 두 가지 시도를했지만, 문서는 이것을하는 방법에 대해별로 도움이되지 않습니다.

: 아파치-SOLR-3.1.0/예/예 - 다이 하이드로/SOLR/티카/conf의

이 내 dataConfig된다

나는 SOLR 배포에있는 SOLR 구성을 사용하고 있습니다

<dataConfig> 
    <dataSource type="BinFileDataSource" name="bin"/> 
    <document> 
    <entity name="f" processor="FileListEntityProcessor" recursive="true" 
      rootEntity="false" dataSource="null" baseDir="C:/solrtestsmall" 
      fileName=".*\.(DOC)|(PDF)|(pdf)|(doc)" onError="skip"> 

     <entity name="tika-test" processor="TikaEntityProcessor" 
       url="${f.fileAbsolutePath}" format="text" dataSource="bin" 
       onError="skip"> 
     <field column="Author" name="author" meta="true"/> 
     <field column="title" name="title" meta="true"/> 
     <field column="text" name="text"/> 
     </entity> 

     <field column="fileName" name="fileName"/> 
    </entity> 
    </document> 
</dataConfig> 

올바르게 구성하는 방법과 특정 문서를 찾을 수있는 다른 장소에도 관심이 있습니다.

답변

3

당신은 필드 섹션에서의 schema.xml에 '파일 이름을'추가하는 것을 잊지 마십시오

<field column="file" name="fileName"/> 

대신 파일 이름 파일을 사용해야합니다.

<field name="fileName" type="string" indexed="true" stored="true" /> 
관련 문제