응용 프로그램을 편집하지 않고 MapReduce 작업의 중간 (지도 단계) 출력을 기록하기 위해 출력 할 수있는 방법이 있습니까? (응용 프로그램은 광산이 아니지만 클러스터는 내가 원하는대로 Hadoop Cluster를 설정할 수 있습니다.)Hadoop MapReduce 중간 출력
답변
keep.task.files.pattern 매개 변수를 사용하여 중간 파일을 유지할 수 있습니다. 작업이 완료되면 중간 파일을 수동으로 정리해야합니다. 맵/리사이징 작업 속성이므로 구성 파일에 설정해야하며 jar 파일이 다시 패키지화되어야합니다.
정교하게 주시겠습니까? 이 매개 변수를 설정하고 출력 dirs 및 맵된 로컬 캐시에서 어디에서나 검색했지만 아무 위치도 출력하지 않습니다 ... – ihadanny
... $ {mapred.output.dir }/_ 임시이지만, "_attempt_local_0003_r_000000"폴더를 줄이는 것이고, 결코 "m"대응 파일은 찾을 수 없다. – ihadanny
'keep.task.files.pattern'을'. * 00000. *'으로 설정했다. -site.xml'이고'core-site.xml'의 매개 변수'hadoop.tmp.dir'는'$ HADOOP_HOME \ tmp'로 설정되어 있습니다. 작업을 실행 한 후 file.out과 file.out.index는'$ HADOOP_HOME/tmp/mapred/local/taskTracker/praveensripati/jobcache/job_201111031937_0001/attempt_201111031937_0001_m_000001_0/output' 폴더에 있습니다. 이러한 파일은 SequenceFile 형식입니다. [여기] (http://goo.gl/7fJzT)는 시퀀스 파일을 읽는 샘플 코드입니다. 어떤 패턴을 사용 했습니까? –
- 1. 프로그래밍 방식으로 Hadoop Mapreduce 프로그램 출력 읽기
- 2. Hadoop SequenceFile 워크 플로우의 중간 작업에 대한 입/출력
- 3. Hadoop 클러스터에서 mapreduce jar 실행
- 4. HBase에서 스트리밍되는 Hadoop mapreduce
- 5. Hadoop MapReduce 생각
- 6. Hadoop mapreduce 프로그래밍
- 7. Hadoop mapreduce 예제 설명서
- 8. Hadoop MapReduce 처리량 질문
- 9. Hadoop : Iterative MapReduce 성능
- 10. Hadoop : 중간 병합 실패
- 11. Hadoop MapReduce - 각 입력에 대해 하나의 출력 파일
- 12. Hadoop MapReduce InputFormat 사용되지 않으셨습니까?
- 13. Hadoop mapreduce 작업에서 JVM 재사용
- 14. Hadoop Mapreduce 구성 (새 API)
- 15. Hadoop의 증분 MapReduce (mongodb-hadoop 어댑터 사용)
- 16. Hadoop MapReduce : 적절한 입력 파일 크기?
- 17. MapReduce 출력 mongoDB
- 18. Hadoop : MapReduce 동안 OutputCollector는 어떻게 작동합니까?
- 19. (Hadoop) MapReduce - 체인 작업 - JobControl이 중지되지 않습니다
- 20. 감속기 지정시 중간 출력
- 21. 액세스 hbase 테이블 fron hadoop mapreduce
- 22. hadoop MapReduce 정리에 진행 추적 메커니즘 추가
- 23. 많은 파일 읽기 hadoop mapreduce 분산 캐시
- 24. 정확히 돼지가 Hadoop MapReduce 환경을 사용할 때?
- 25. Hadoop MapReduce 작업 입력 파일 ClassNotFound
- 26. 분산 로컬 클러스터링 계수 알고리즘 (MapReduce/Hadoop)
- 27. Hadoop 스트리밍에서 다중 mapreduce 작업 체인화
- 28. Hadoop-MapReduce 용 작은 데이터 세트
- 29. Hadoop MapReduce : Mapper-Reducer의 키로 두 값
- 30. hadoop 필터링 맵 출력
작업을 다시 구성 할 수 있습니까? –