에서 폴더 내의 모든 파일 SOLR에서 폴더를 인덱싱 문제를 가진 지수는 내가 SOLR
예를 들어 데이터-config.xml에
:<dataConfig>
<dataSource type="BinFileDataSource" />
<document>
<entity name="files"
dataSource="null"
rootEntity="false"
processor="FileListEntityProcessor"
baseDir="C:\Temp\" fileName=".*"
recursive="true"
onError="skip">
<field column="fileAbsolutePath" name="id" />
<field column="fileSize" name="size" />
<field column="fileLastModified" name="lastModified" />
<entity
name="documentImport"
processor="TikaEntityProcessor"
url="${files.fileAbsolutePath}"
format="text">
<field column="file" name="fileName"/>
<field column="Author" name="author" meta="true"/>
<field column="text" name="text"/>
</entity>
</entity>
</document>
는 난의 schema.xml를 만들 :
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
<field name="fileName" type="string" indexed="true" stored="true" />
<field name="author" type="string" indexed="true" stored="true" />
<field name="title" type="string" indexed="true" stored="true" />
<field name="size" type="plong" indexed="true" stored="true" />
<field name="lastModified" type="pdate" indexed="true" stored="true" />
<field name="text" type="text_general" indexed="true" stored="true" multiValued="true"/>
마침내 나는 RequestHandler를하고 dataImportHandler 및 dataImport을 추가 파일 solrConfig.xml을 수정 핸들러-추가 항아리 :
<requestHandler name="/dataimport" class="solr.DataImportHandler">
<lst name="defaults">
<str name="config">example-data-config.xml</str>
</lst>
</requestHandler>
나는 그것을 실행
그 결과는 다음과 같습니다 (개의 다른 형식의 20.000 파일처럼 해당 폴더 내부
을가 평, 된 .java, 된 .wsdl, 등)
어떤 제안을 주시면 감사하겠습니다. 감사합니다 :)
마치 recursive = "true"가 어떤 식 으로든 작동하지 않는 것처럼 보입니다. 하위 폴더를 사용해 보았는데 하위 폴더 정보가 올바르게 색인되었습니다. 그러나 근본 원인은 내가이 시점에서 정말로 모른다는 것입니다 – user1848435