Nutch-Hadoop Integration에 가장 적합한 Linux 배포판을 찾으려고합니다. 우리는 Nutch를 통해 큰 콘텐츠를 크롤링하기 위해 클러스터를 사용할 계획입니다. 이 질문에 대한 자세한 설명이 필요한 경우 알려주십시오.Nutch-Hadoop에 가장 적합한 Linux 배포판은 무엇입니까?
감사합니다.
Nutch-Hadoop Integration에 가장 적합한 Linux 배포판을 찾으려고합니다. 우리는 Nutch를 통해 큰 콘텐츠를 크롤링하기 위해 클러스터를 사용할 계획입니다. 이 질문에 대한 자세한 설명이 필요한 경우 알려주십시오.Nutch-Hadoop에 가장 적합한 Linux 배포판은 무엇입니까?
감사합니다.
이 경우 주요 Linux 배포간에 별다른 차이가 없습니다. 그러나 hadoop 꾸러미가 준비되어있는 것이 좋습니다. 저는 Cloudera의 Hadoop 배포판을 데비안에서 사용하고 있습니다. 매우 효과적입니다.
하둡과 HBase를 패키지는 다음 데비안 안정 버전에있을 것입니다 :