2012-11-27 4 views
0

반 분산 모드에서 로컬로 정상적으로 실행되는 hadoop 1.0.4 응용 프로그램을 작성했습니다. 클러스터에 Cloudera Hadoop 4를 설치했습니다. CDH4는 hadoop 사이트에서 안정적이라고 나와 있기 때문에 hadoop 1.0.4를 실행한다고 생각했지만, 그렇지는 않습니다. CHD4는 하둡 1.0.4와 호환되지 않기 때문에이 것을 바로 내 assmption에Cloudera Hadoop이 (가) 실행되지 않았습니다. 1.0.4?

12/11/27 16:14:38 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 
12/11/27 16:14:38 INFO input.FileInputFormat: Total input paths to process : 16 
12/11/27 16:14:39 INFO mapred.JobClient: Running job: job_201211271520_0004 
12/11/27 16:14:40 INFO mapred.JobClient: map 0% reduce 0% 
12/11/27 16:14:50 INFO mapred.JobClient: Task Id : attempt_201211271520_0004_m_000013_0, Status : FAILED 
Error: Found interface org.apache.hadoop.mapreduce.TaskAttemptContext, but class was expected 
12/11/27 16:14:50 INFO mapred.JobClient: Task Id : attempt_201211271520_0004_m_000000_0, Status : FAILED 
... and so on... 

가 나는 건가요 : 내 클러스터 나는 다음과 같은 오류를 얻을에 응용 프로그램을 실행할 때? 그리고 만약 그렇다면 누군가 hadoop 1.0.4와 호환되는 버전을 알고 있습니까? 차라리 응용 프로그램을 다시 작성하는 것보다 cloudera 소프트웨어를 전환합니다.

답변

3

정확합니다. CDH3은 버전 0.20.2를 사용하고, CDH4는 버전 2.0.0을 사용합니다. Hadoop 버전의 명칭은 엉망이며, 나는 그것을 이해하는 척하지 않는다. 그러나 당신이 this blog post by Cloudera에 명시된 다음에 따라 CDH3를 사용할 수 있습니다 다음과 같습니다

"The CDH3 distribution incorporated the 0.20.2 Apache Hadoop release plus the features of the 0.20.append and 0.20.security branches that collectively are now known as “1.0.” The Apache Hadoop in CDH3 has been the equivalent of the recently announced Apache Hadoop 1.0 for approximately a year now."

를이 경우, 나는 CDH3 시도를 줄 것이다. 작동하지 않는다면 Cloudera 설치 외에 다른 것을 찾아야 할 수도 있습니다.

+0

감사합니다. 나중에 사용해 보겠습니다. 그것이 효과가 있는지 알려 드리겠습니다. – KarelV

+0

CDH3.5 그렇습니다;) 분명히 HAdoop 2.0.0 라이브러리로 다시 컴파일하면 내 문제가 해결되지만 테스트하지는 않았습니다. – KarelV

관련 문제