2012-02-23 4 views
1

나는 Tika 파서를 사용하여 내 파일을 Solr에 색인화합니다. 내 파서 (XMLParser를 확장)를 만들었습니다. 그것은 내 자신의 mimetype을 사용합니다. 내 xml 파일 렸기 때문에 새로운 MIME 형식의 정의를 넣어 주문 MIME 형식에서원격 글래스 피쉬에서 (Tika를 사용하여) 구문 분석

src 
|-main 
    |-some_packages 
     |-MyParser.java 
    |resources 
     |-META-INF 
      |-services 
       |-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java) 
     |_org 
      |-apache 
       |-tika 
        |-mime 
         |-custom-mimetypes.xml 

일부 특수 태그가 : 나는 내 다음과 같습니다 jar 파일을 만들었습니다.

지금 어디에 문제가 있습니까? 내 로컬 컴퓨터에 설치된 glassfish에서 Solr을 사용하여 구문 분석 및 인덱싱을 테스트했습니다. 그것은 잘 작동했습니다. 그런 다음 원격 서버에 설치하려고합니다. 동일한 버전의 glassfish가 설치되어 있습니다 (3.1.1). Solr 응용 프로그램을 복사하여 붙여 넣었습니다. 모든 라이브러리 (tika jar 및 사용자 정의 파서가있는 jar 파일 포함)가있는 홈 디렉토리입니다. 불행히도 그것은 작동하지 않습니다. 파일을 Solr에 게시 한 후 컨텐츠 유형 필드에 내 맞춤 mime 유형이 있음을 알 수 있습니다. 그러나 MyParser 클래스가 실행되지 않은 것처럼 보이는 필드는 없습니다. 내가 얻을 수있는 유일한 필드는 더블린 코어의 것들입니다. Tika가 XMLParser 만 사용하고 있는지 (단순히 인쇄 라인을 추가하여) 확인했습니다. 비슷한 문제가있는 사람이 있습니까? 어떻게 처리할까요?

+1

가 해결 ... 자바 5로 컴파일 된 :) 문제가 자바 7 ... – lotk

+0

사용하는 것을 당신은 할 수 있습니다 그것은 밝혀졌다 그것을 답변으로 추가하려면 – Gagravarr

답변

0

문제는 내가 파서를 컴파일 자바 7 사용되었다했지만 아파치 티카는

관련 문제