2013-07-08 3 views
0

NUTCH 1.2를 사용하여 사이트를 성공적으로 크롤링했습니다. 이제 이것을 solr 3.1과 통합하려고합니다. 문제는 내가 명령 $ bin/nutch solrindex localhost : 8080/solr/crawl/crawldb crawl/linkdb cra wl/segments/*를 발행 할 때 발생합니다. // 로컬 호스트 : : 조직에서 8080/SOLR/업데이트 중량 = javabin & 버전 = 2 나는nutch 1.2 solr 3.1 통합 문제

이 문제를

잘못된 요청

요청을 해결하기 위해 도와주세요 내 nutch 로그를 부착하고있다. apache.solr.client.solrj.impl.CommonsHttpSolrServer.request (CommonsHttpSolrServer.java:436) at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request (CommonsHttpSolrServer.java:245) at org.apache. solr.client.solrj.request.AbstractUpdateRequest.process (AbstractUpdateRequest.java:105) at org.apache.solr.client.solrj.So lrServer.add (SolrServer.java:49) at org.apache.nutch.indexer.solr.SolrWriter.close (SolrWriter.java:75) at org.apache.nutch.indexer.IndexerOutputFormat $ 1.close (IndexerOutputFormat.java 48) org.apache.hadoop.mapred.ReduceTask.runOldReducer (ReduceTask.java:474에서 ) org.apache.hadoop.mapred.ReduceTask.run (ReduceTask.java:411에서 )에서 org.apache.hadoop .mapred.LocalJobRunner $ Job.run (LocalJobRunner.java:216) 2013-07-08 17 : 38 : 47,577 오류 solr.SolrIndexer - java.io.IOException : 작업이 실패했습니다!

답변

0

다음과 같은 Apache Commons 라이브러리를 클래스 경로에 추가해야합니다 : commons-httpclient.jar (Nutch 설치에서 사용되는 다른 JAR이있는 동일한 폴더에 넣으십시오).

당신은 당신의 Nutch 버전의 이전 버전을 사용하는 수 있습니다 HttpClient를 여기 http://hc.apache.org/httpcomponents-client-ga/

의 현재 버전을 찾을 수 HttpClient를하고 HttpClient를의 현재 버전은 이전 버전과 호환되지 않습니다 . 이 경우 이전 버전의 HttpClient를 다운로드하고 이전 버전을 라이브러리에 포함시켜야합니다.

+0

가치있는 통찰력을 얻으려면 고맙습니다. 추가 된 HTTP 클라이언트 항아리하지만 여전히 하나의 오류가 있습니다 ... java.io.IOException : 작업이 실패했습니다! –

+0

님이 nutch 로그를 포함하도록 내 게시물을 편집했습니다. –

+0

글쎄, 환영합니다. 이것은 당신의 문제가 해결되었음을 의미합니다.이 질문은 SO 규칙에 따라 닫혀 야합니다. 다음 오류 (IOException)를 해결하는 데 문제가 있으면 다른 질문을해야합니다. 그리고 원래 질문에 새 오류 메시지를 추가하지 않아도됩니다. 이것은 SO가 작동하는 방식이 아닙니다. – bpgergo