MapFile에 출력하고 싶은 hadoop 작업이 있는데, MapFileOutputFormat이없는 hadoop 0.20.203을 실행중인 클러스터에서 실행해야합니다. 병렬로 MapFile에 SequenceFileOutputFormat (여러 SequenceFile을 포함 할 수 있다고 생각합니다)의 출력을 변환 할 수있는 방법이 있습니까? ArrayFile은 무엇입니까? (키가 모두 정수이고 상대적으로 응축 된 경우)MapFileOutputFormat for hadoop 0.20.203
0
A
답변
1
MapFileOutputFormat은 0.20.203에 있습니다. SequenceFile에서 MapFile로 변환 할 필요가 없습니다.
참고 : SequenceFile을 MapFile로 변환하는 것은 SequenceFile을 열고 SequenceFile에 대한 인덱스를 생성하는 MapFile#fix을 사용하여 수행 할 수 있습니다. 이것의 선구자는 SequenceFile의 내용을 정렬해야한다는 것이므로 MR 작업을 생성 할 수 있습니다. zip의 MapFileFixer.java에는 샘플 코드가 있습니다.
관련 문제
- 1. MultipleOutputs은 0.20.203
- 2. Hadoop에서 MapFileOutputFormat 사용
- 3. hadoop의 외부 항아리 0.20.203
- 4. 빌드 Hadoop for Eclipse 지침에 따라
- 5. Hadoop : libhdfs.so를 컴파일하는 방법은 무엇입니까?
- 6. 자바 코드에 의한 Hadoop 명령 트리거
- 7. CDH (Cloudera Distribution for hadoop)는 사용하도록 공개 된 자료입니까?
- 8. 사용할 수있는 hadoop 버전은 무엇입니까?
- 9. Jojo in Hadoop? 그래픽을위한 Hadoop?
- 10. Hadoop DistributedCache가 hadoop 작업에서 상태
- 11. Hadoop (Fado) in Hadoop (Hadoop in Action exercise)
- 12. Windows의 Hadoop
- 13. Hadoop Streaming 용 Hadoop Job 객체 빌드하기
- 14. Hadoop 패키지의 hadoop-ec2 : 영역을 지정하는 방법?
- 15. 스트리밍 데이터 및 Hadoop? (Hadoop Streaming이 아님)
- 16. Hadoop DistributedCache
- 17. Hadoop CustomInputFormat
- 18. Hadoop outputCollector
- 19. Azure의 Hadoop
- 20. hadoop NullPointerException
- 21. hadoop 스트리밍 작업이보고되지 않습니까?
- 22. Oazie for Oadoie for Hadoop을 사용하는 모범 사례
- 23. hadoop mapreduce에서 중복 됨
- 24. Hadoop 매퍼에 인수 전달
- 25. 쉘에 mrjob 파이핑이있는 hadoop
- 26. hadoop mapreduce를 사용하는 파일의 상호 단어
- 27. hadoop with cygwin : hadoop-daemon.sh : 찾을 수 없습니다.
- 28. hadoop 데몬이 시작되지 않음
- 29. 메이븐을 사용하여 빌드 hadoop
- 30. hadoop -libjars 및 ClassNotFoundException
예. 그렇지만 이전 스타일의 org.apache.hadoop.mapred.FileOutputFormat을 확장합니다. http://hadoop.apache.org/common/docs/r0.20.205.0/api/org/와 호환되지 않습니다. apache/hadoop/mapreduce/Job.html # setOutputFormatClass (java.lang.Class) – dspyz
이전/새 MR API에 대한 언급이 OP에 없었습니다. BTW, 새로운 MR API의 어떤 기능을 사용하고 있습니까? 오래된 MR API에는 없습니다. 특별한 요구 사항이 없다면 이전 API를 사용하기 위해 이식하기가 어렵지 않아야합니다. 그렇지 않으면 [MapFileOutputFormat] (http://svn.apache.org/repos/asf/hadoop/common/trunk/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-core/src/main/) java/org/apache/hadoop/mapreduce/lib/output/MapFileOutputFormat.java)가 새 MR API로 트렁크에 있습니다. 이 코드로 Hadoop을 만들 수 있습니다. –
나는 Job.setOutputFormatClass가 Class org.apache.hadoop.mapreduce.OutputFormat> 을 확장하고 MapFileOutputFormat.class의 유형은 Class 하나는 mapreduce.OutputFormat이고 다른 하나는 mapred.OutputFormat입니다. 그들은 호환되지 않습니다 편집 : 죄송합니다, 나는 Mapper와 내가 OutputFormat을 의미 했음 – dspyz