0
배포 모드에서 Nutch를 실행하는 것은 Hadoop을 기반으로하는 분산 크롤링이지만 로컬 모드에서 실행할 때 무엇을하는지 완전히 이해할 수 없다는 것을 알고 있습니다. 이 경우 Nutch는 Hadoop과 독립적입니까? MapReduce를 기반으로하지 않는 로컬 모드의 크롤링 프로세스가 있습니까?Nutch는 Hadoop과 무관 한 로컬 모드입니까?
배포 모드에서 Nutch를 실행하는 것은 Hadoop을 기반으로하는 분산 크롤링이지만 로컬 모드에서 실행할 때 무엇을하는지 완전히 이해할 수 없다는 것을 알고 있습니다. 이 경우 Nutch는 Hadoop과 독립적입니까? MapReduce를 기반으로하지 않는 로컬 모드의 크롤링 프로세스가 있습니까?Nutch는 Hadoop과 무관 한 로컬 모드입니까?
Nutch는 실행 방법에 관계없이 MapReduce를 기반으로합니다. Hadoop 라이브러리는 로컬 모드에서 Nutch의 종속성이며, Nutch는 클래스 경로에 Hadoop 관련 라이브러리를 넣고이를 단일 JVM에서 모두 실행합니다. 분산 모드에서는 'hadoop'명령이 호출됩니다.
는 Nutch script
PS를 참조하십시오 : 단일 컴퓨터에서 Nutch를 사용하는 경우, 당신이 맵리 듀스 UI 크롤링 + 병렬 처리 등을 모니터링 할 수 있도록 의사 분산 모드에서 실행하는 것이 합리적이다 ...
확인 . 따라서 로컬 모드에서 Nutch는 Hadoop의 MapReduce 메커니즘 만 사용합니다. 내가 맞습니까? –
'기타'-> HDFS? 기본적으로 사용되지 않습니다. Nutch 1.x BTW에 대해 이야기하고 있습니까? –
예 1.12와 함께 작업하고 있습니다. HDFS를 독립형 모드로 사용하는 방법은 무엇입니까? –