2014-01-30 6 views
0

이 아파치 티카 전용 구성 파일을 사용하여 구성 할 수 있습니다 섹션 상태를 문서화 : https://cwiki.apache.org/confluence/display/solr/Uploading+Data+with+Solr+Cell+using+Apache+Tika구성 아파치 티카

<str name="tika.config">/my/path/to/tika.config</str> 

명백한 문제는 - 어디를 수정하는 방법에 대한 샘플 tika.config 및 명령은 어디에서 찾을 수 있습니까?

내 목표는 무엇입니까? 나는 당신이

<lib dir="../../../../contrib/extraction/lib/" regex="tika-core-\d.*\.jar" /> 
    <lib dir="../../../../contrib/extraction/lib/" regex="tika-parsers-\d.*\.jar" /> 

너무

**<requestHandler name="/update/extract" 
        startup="lazy" 
        class="solr.extraction.ExtractingRequestHandler" > 
    <lst name="defaults"> 
     <str name="lowernames">true</str> 
     <str name="fmap.meta">ignored_</str> 
     <str name="fmap.content">_text_</str> 
     <str name="capture">body</str> 
    </lst> 
     <str name="tika.config">**html-config.xml**</str> 
    </requestHandler>** 

html로이 라인을 추가 solrconfig.xml 파일에 다음 줄을 추가 할 필요가 미디어 파일의 내용을

+0

유엔에서 사용되는 Tika 구성이 많이 있습니다 소스 트리에 포함되어있는 Tika 구성 코드를 테스트합니다. [이 도움말 중 어떤 것도] (https://svn.apache.org/repos/asf/tika/trunk/tika-core/src/test/resources/org)/아파치/tika/설정 /)? – Gagravarr

+0

글쎄, 그게 아무것도 아니지만, 더 나은 ...하지만 아무런 힌트 옵션을 지원하는 방법과 구성 파일을 사용하여 다른 목표를 달성하기 위해 –

+0

내가 이상한 - 응용 프로그램을 지원하지만 말 그대로 인터넷에서 하나의 흔적을 의미 –

답변