2014-01-11 5 views
0

저는 여러 개의 zip 파일과 이러한 zip 파일에 xml 및 image 파일이있는 zip 파일을 처리해야합니다. 데이터를 XML 데이터의 내용으로 제공해야하는 solr로 데이터를 인덱싱해야합니다.Solr에 zip 파일을 처리하십시오.

나는 그것을 질의 할 때 zip 파일 이름 만 반환하는 기본 solr-Tika 예제를 시도했다. 어떻게 이것을 달성할까요? 티카가 내 요구 사항을 처리하는 유일한 방법입니까?

미리 감사드립니다.

+0

왜 zip 파일 내부의 파일을 인덱싱 할 수 없습니까? 왜 zip 파일을 전달합니까? –

답변

2

Tika가 원하는대로 작동하게하려면 현재 Solr에 the patch attached to this ticket을 적용해야 할 것입니다.

그렇습니다. 다른 작업없이 ZIP 파일의 내용을 색인하려는 경우 Tika 만 선택할 수 있습니다.

관련 문제