2012-03-28 6 views
2

"Apache Nutch 1.4"로 사이트를 색인화하려고하는데 아래 명령을 실행하면 "java.io.IOException : Job failed"오류가 발생합니다.java.io.IOException : 작업이 실패했습니다.

bin/nutch solrindex http://localhost:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/* 
나는 Nutch와 함께 작동하도록 "아파치 SOLR은 3.5.0"하지만 불행히도

시뮬레이션

[email protected]:/usr/share/nutch/runtime/local$ bin/nutch solrindex  http://localhost:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/* 
SolrIndexer: starting at 2012-03-28 18:45:25 
Adding 48 documents 
java.io.IOException: Job failed! 
[email protected]:/usr/share/nutch/runtime/local$ 

수있는 사람의 도움 m 작동하지 않습니다 "Tomca6"및 설치 제발?

+0

예외 스택 추적 어딘가에 로그 파일이 있습니까? – jpountz

+0

다음 링크에 로그를 남기고 [Hadoop.log] (https://raw.github.com/gist/2231654/564d7bf5a59262ee9bd63f5a6434e68d822156fb/hadoop.log) – Agutoli

+1

@Agutoli I 'd 'd Solr로부터 얻은 BadRequest 오류의 원인을 이해하기 위해 solr 로그 파일을 살펴볼 것을 제안한다. 여기에 관련 부분을 붙일 수 있습니까? – javanna

답변

0

이 오류는 Nutch 결과 필드를 Solr 필드에 매핑하는 것이 정확하지 않거나 불완전한 경우에 자주 발생합니다. 그 결과 "업데이트"작업이 Solr 서버에 의해 거부됩니다. 불행히도, 호출 체인의 어느 시점에서이 오류는 약간의 오해의 소지가있는 "IO 오류"로 변환됩니다. 내 권장 사항은 Solr 서버의 웹 콘솔 (링크 제출과 동일한 URL을 사용하여 액세스 할 수 있음, 예 : http://some.solr.server:8983/solr/)에 액세스하고 로깅 탭으로 이동하는 것입니다. 매핑과 관련된 오류가 표시됩니다.

관련 문제