Hadoop Streaming 작업의 출력 파일 이름을 제어하는 방법이 있습니까? 특히 필자는 필자의 작업 출력 파일의 내용과 이름을 감속기가 출력하는 케킷으로 정리하고 싶습니다. 각 파일은 하나의 키에 대한 값만 포함하고 그 이름은 키가됩니다.Hadoop 스트리밍 작업의 출력 파일 이름과 내용을 어떻게 제어합니까?
업데이트 : 방금 찾은 답변 - 작업 출력 형식으로 MultipleOutputFormat에서 파생 된 Java 클래스를 사용하면 출력 파일 이름을 제어 할 수 있습니다. http://hadoop.apache.org/core/docs/current/api/org/apache/hadoop/mapred/lib/MultipleOutputFormat.html
나는 거기에 이것에 대한 어떤 샘플을 보지 못했어요 ... 사람이 사용자 정의 출력 형식 자바 클래스의 사용을 만드는 하둡 스트리밍 샘플을 지적 할 수 있습니까?
새 문서에 대한 링크 끊어짐 –