2012-09-10 1 views
0

hadoop 1.03에서 nutch-1.5를 실행하려고하면 다음 오류가 발생합니다. Hadoop 1.03 및 Nutch 1.5 문제

**Caused by: java.io.IOException: can't find class: org.apache.nutch.protocol.ProtocolStatus because org.apache.nutch.protocol.ProtocolStatus** 

하둡 항아리 nutch - 1.5.job org.apache.nutch.crawl.Crawl URL을 -dir URL을 -depth 1 -topN 5

내가 nutch-1.3의 버그 리포트 https://issues.apache.org/jira/browse/NUTCH-1084를 볼 수 있지만 것 같습니다 그것은 아직 해결되지 않았습니다. 도움을 주시면 감사하겠습니다.

http://wiki.apache.org/nutch/NutchHadoopTutorial

http://wiki.apache.org/nutch/NutchTutorial

http://wiki.apache.org/hadoop/HowToConfigure

편집

나는이 튜토리얼 http://www.rui-yang.com/develop/build-nutch-1-4-cluster-with-hadoop/을 따라 나를 위해 작동합니다

나는이 자습서를 따르십시오. 정확히 무엇이 문제를 해결하는지 모르겠습니다. 나는 하나의 노드에서 hadoop을 실행한다. 다음과 같이 변경합니다.

1. hadoop-env.sh, core-site.xml, hdfs-site.xml, mapred-site.xml, master, slave를 hadoop/conf에서 nutch/conf로 복사하고 다시 nutch

2.export의 CLASSPATH = $ NUTCH_HOME/실행/지역/lib에

나는 다음과 같은 튜토리얼을 만들 http://dataspider.blogspot.com.es/2012/09/instalacion-de-hadoop.html

답변