2011-05-05 4 views
1

Nutch v1.2에 대한 질문이 있습니다.Nutch 1.2 (크롤링 또는 구문 분석) mp3

MP3를 크롤링/파싱하고 그 결과를 Solr 1.4로 인덱싱하는 방법을 설명 할 수 있습니까?

내가 할 수있는 특정 플러그인이 있습니까?

도움 주셔서 감사합니다.

답변

1

MP3 오디오 파일의 헤더를 구문 분석하기 위해 Nutch와 함께 사용할 수있는 parse-mp3 플러그인이 있습니다. Nutch 플러그인의 전체 목록

, 체크 아웃 Plugin Central

+1

하지만 난 MP3 파서 플러그인 버전 1.2에서 버전 1.1에서 제거 생각하는 그 무언가라는 티카 파서하지만 nutch MP3 파일의 URL을 얻을 수 없다는 문제와 만약 내가 URL을 넣어 씨앗 파일을 다운로드하지 mp3을 그렇게 파서에 파서를 만들 수있는 기회가 있다면. –

+0

아아, 그렇습니다. 0.9 이후에 삭제 한 것을 잊었습니다. – Brian