2012-05-09 6 views
1

좀 URL을 크롤링하려면이 명령을 사용하고 있습니다 :nutch 1.4를 구성하는 방법은 무엇입니까?

./bin/nutch crawl urls/urls -dir crawl -depth 2 

그것은 다음과 같은 오류를 보여주고있다 :

Could not find or load main class org.apache.nutch.crawl.Crawl 

어떻게이 문제를 해결할 수 있습니까?

+0

'$ CLASSPATH'에 문제가있는 것 같습니다. 즉 필요한'.class' 파일은'nutch' 스크립트가 자체적으로 설정하는'CLASSPATH'에 존재하지 않습니다. 어떻게 너트를 설치 했니? [이 지침] (http://wiki.apache.org/nutch/NutchTutorial)을 따랐습니까? 그렇지 않다면 시도해보고 우리와 공유하십시오. 어떤 단계가 실패합니까? – ArjunShankar

답변

2

여기이 단계는 나를 위해 일한 http://www.params.me/2011/07/apache-nutch-13-setup.html

를 참조하십시오. 이 문제에 직면하면 알려주세요.

+0

덕분에, –

+0

을 만들 수 있습니다. hadoop을 사용하여 Nutch 1.4를 구성 할 수 있습니까? 0.20 –

+1

http://www.rui-yang.com/develop/build-nutch-1-4-cluster-with-hadoop/ –

관련 문제