나는 내 우분투 데스크탑에 아파치 nutch 2.2.1을 설치하고 실행하려고합니다. 초보자로서 나는 공식 웹 사이트에서 약간 혼란스러운 튜토리얼을 발견했다. 나는 내 자신의 바탕 화면에서 실행한다면아파치 nutch 설정 2.2.1
, 그것은 빈/nutch 명령을 실행
$NUTCH_HOME/runtime/local
로 이동 맞습니까?
어디에서 urls 파일을 넣어야합니까? 사용 클래스 : 나는 올바른 디렉토리에 나는 경우 (이 거기에 시드 목록 seed.txt에서)
$NUTCH_HOME/runtime/local
아래를, 내가 명령을
bin/nutch crawl urls -dir crawl -depth 1
InjectorJob을 실행이 문제를 가지고 있었다 Gora 저장소 클래스로서의 org.apache.gora.memory.store.MemStore. InjectorJob : 필터에 의해 거부 된 총 URL 수 : 0 InjectorJob : 정규화 및 필터링 후 주입 된 총 URL 수 : 0 스레드 "main"의 예외 java.lang.RuntimeException : 작업 실패 : name = generate : null, jobid = job_local1613558008_0002 at org.apache.nutch.util.NutchJob.waitForCompletion (NutchJob.java:54) at org.apache.nutch.crawl.GeneratorJob.run (GeneratorJob.java:199) at org.apache.nutch.crawl .Crawler.runTool (Crawler.java:68) at org.apache.nutch.crawl.Crawler.run (Crawler.java:152) at org.apache.nutch.crawl.Crawler.run (Crawler.java:250)) at org.apache.hadoop.util.ToolRunner.run (ToolRunner.java:65) at org.apache.nutch.crawl.Crawler.main (Crawler.ja 버지니아 : 257)
나는 튜토리얼 3.3 까지 1 http://wiki.apache.org/nutch/NutchTutorial 다음과 인젝터가 URL을하지 않았기 때문에이 문제가 발생하는 것 같다 고라 HBase를 등 를 구성 아직입니다. 누구든지이 문제를 해결하는 방법을 알고 있습니까? 고마워요!
은 당신이 자습서를 수행 할 필요가 2.2.1 Nutch 2.x : http://wiki.apache.org/nutch/Nutch2Tutorial –