2017-03-14 1 views
0

배포 모드에서 Nutch를 실행하는 것은 Hadoop을 기반으로하는 분산 크롤링이지만 로컬 모드에서 실행할 때 무엇을하는지 완전히 이해할 수 없다는 것을 알고 있습니다. 이 경우 Nutch는 Hadoop과 독립적입니까? MapReduce를 기반으로하지 않는 로컬 모드의 크롤링 프로세스가 있습니까?Nutch는 Hadoop과 무관 한 로컬 모드입니까?

답변

2

Nutch는 실행 방법에 관계없이 MapReduce를 기반으로합니다. Hadoop 라이브러리는 로컬 모드에서 Nutch의 종속성이며, Nutch는 클래스 경로에 Hadoop 관련 라이브러리를 넣고이를 단일 JVM에서 모두 실행합니다. 분산 모드에서는 'hadoop'명령이 호출됩니다.

Nutch script
PS를 참조하십시오 : 단일 컴퓨터에서 Nutch를 사용하는 경우, 당신이 맵리 듀스 UI 크롤링 + 병렬 처리 등을 모니터링 할 수 있도록 의사 분산 모드에서 실행하는 것이 합리적이다 ...

+0

확인 . 따라서 로컬 모드에서 Nutch는 Hadoop의 MapReduce 메커니즘 만 사용합니다. 내가 맞습니까? –

+0

'기타'-> HDFS? 기본적으로 사용되지 않습니다. Nutch 1.x BTW에 대해 이야기하고 있습니까? –

+0

예 1.12와 함께 작업하고 있습니다. HDFS를 독립형 모드로 사용하는 방법은 무엇입니까? –

관련 문제