2014-12-09 4 views
0

나는 내 우분투 데스크탑에 아파치 nutch 2.2.1을 설치하고 실행하려고합니다. 초보자로서 나는 공식 웹 사이트에서 약간 혼란스러운 튜토리얼을 발견했다. 나는 내 자신의 바탕 화면에서 실행한다면아파치 nutch 설정 2.2.1

  1. , 그것은 빈/nutch 명령을 실행

    $NUTCH_HOME/runtime/local 
    

로 이동 맞습니까?

  1. 어디에서 urls 파일을 넣어야합니까? 사용 클래스 : 나는 올바른 디렉토리에 나는 경우 (이 거기에 시드 목록 seed.txt에서)

    $NUTCH_HOME/runtime/local 
    

아래를, 내가 명령을

bin/nutch crawl urls -dir crawl -depth 1 

InjectorJob을 실행이 문제를 가지고 있었다 Gora 저장소 클래스로서의 org.apache.gora.memory.store.MemStore. InjectorJob : 필터에 의해 거부 된 총 URL 수 : 0 InjectorJob : 정규화 및 필터링 후 주입 된 총 URL 수 : 0 스레드 "main"의 예외 java.lang.RuntimeException : 작업 실패 : name = generate : null, jobid = job_local1613558008_0002 at org.apache.nutch.util.NutchJob.waitForCompletion (NutchJob.java:54) at org.apache.nutch.crawl.GeneratorJob.run (GeneratorJob.java:199) at org.apache.nutch.crawl .Crawler.runTool (Crawler.java:68) at org.apache.nutch.crawl.Crawler.run (Crawler.java:152) at org.apache.nutch.crawl.Crawler.run (Crawler.java:250)) at org.apache.hadoop.util.ToolRunner.run (ToolRunner.java:65) at org.apache.nutch.crawl.Crawler.main (Crawler.ja 버지니아 : 257)

나는 튜토리얼 3.3 까지 1 http://wiki.apache.org/nutch/NutchTutorial 다음과 인젝터가 URL을하지 않았기 때문에이 문제가 발생하는 것 같다 고라 HBase를 등 를 구성 아직입니다. 누구든지이 문제를 해결하는 방법을 알고 있습니까? 고마워요!

+0

은 당신이 자습서를 수행 할 필요가 2.2.1 Nutch 2.x : http://wiki.apache.org/nutch/Nutch2Tutorial –

답변

1

당신이 Nutchsite.xml이 언급 당신은 고라와 HBase를 통합 할 경우에 명령

-1

을 실행하는 $NUTCH_HOME/runtime/deploy에 가야

Nutch를 들어
<property> 
     <name>storage.data.store.class</name> 
     <value>org.apache.gora.hbase.store.HBaseStore</value> 
     <description>Default class for storing data</description> 
    </property> 
+0

당신이 무엇을 제안하고 있는지, 또는 당신이 여기서 대답하고있는 부분이 무엇인지 명확하지 않습니다. 자세한 내용을 얻기 위해이 답변을 편집 할 수 있습니까? –