Amazon EMR에서 wordcount 예제를 실행하려고합니다.Amazon EMR 애플리케이션의 이환기 수 설정
-1- 첫째, 나는 다음과 같은 명령을 사용하여 클러스터를 만들 :
./elastic-mapreduce --create --name "MYTEST"--alive
이 하나가있는 클러스터를 생성 인스턴스와에서는 jobID 반환,
이 가 이-2- 둘째, 나는 다음과 같은 명령을 사용하여 작업을 시작 J-12NWUOKABCDEF을 말할 수 :
./elastic-mapreduce --jobflow J-12NWUOKABCDEF --jar S3N ://mybucket/jar-files/wordcount.jar - main-class abc.WordCount,515,--arg S3N : // mybucket/입력 데이터/
--arg S3N : // mybucket/출력 데이터/
--arg -Dmapred.reduce.tasks = 3
내 WordCount 클래스는 abc 패키지에 속해 있습니다.
이것은 문제없이 실행되지만 하나의 감속기 만 얻습니다. "mapred.reduce.tasks = 3"매개 변수가 무시됨을 의미합니다.
내 응용 프로그램에 사용할 감속기의 수를 지정하는 방법이 있습니까?
감사합니다. Neeraj.
이 방법은 작동하지 않습니다. –
이것은 Hadoop에 내장 된 기능이므로 (https://wiki.apache.org/hadoop/HadoopStreaming 참조) 명령이 내가 가지고있는 것과 일치하는지 다시 확인하십시오 (예 :'--args' 대신'--args'를 사용하십시오. arg는 중요하다). –