다소 이상한 질문이지만 MapReduce가 셔플/정렬의 정렬 부분에서 어떤 종류의 정렬을 사용하는지 알 수 있습니까? Merge 나 Insert (전체 MapReduce 패러다임을 유지하면서)라고 생각 하겠지만 확실하지는 않습니다.MapReduce 셔플/정렬 방법
9
A
답변
9
Quicksort인데, 나중에 분류 된 중간 출력이 함께 병합됩니다. 퀵 소트는 재귀 깊이를 확인하고 너무 깊을 때 포기합니다. 이 경우 Heaport가 사용됩니다.
org.apache.hadoop.util.QuickSort
당신은 hadoop-default.xml의 map.sort.class 값을 통해 사용되는 알고리즘을 변경할 수 있습니다
는 퀵 클래스에서보세요. 내 블로그에Map-Reduce:Shuffle and sort
을 :
-1
더 깊이에 대한 자세한 내용을 읽으려면 게시물에 대해 읽어 주시기 편집에 대한 Hadoop: Some Salient Understandings
관련 문제
- 1. mapreduce 프로그램에 agrs 전달하는 방법
- 2. 클라우드의 MapReduce
- 3. AWS의 MapReduce
- 4. Iterative MapReduce
- 5. MapReduce 문제
- 6. Hadoop mapreduce 프로그래밍
- 7. HBase에서 스트리밍되는 Hadoop mapreduce
- 8. 스칼라에서 MapReduce 구현
- 9. MapReduce 선형 프로그래밍
- 10. Hadoop MapReduce 처리량 질문
- 11. MongoDB MapReduce 통계 엔진
- 12. Hadoop : Iterative MapReduce 성능
- 13. 휴대용 장치에서 mapreduce 실행
- 14. MapReduce 비효율 감속기
- 15. Amazon MapReduce 사용
- 16. 여러 스캔 객체의 HBase Mapreduce
- 17. Amazon Elastic MapReduce : FileSystem의 예외
- 18. Delphi 용 MapReduce 라이브러리가 있습니까?
- 19. Hadoop MapReduce InputFormat 사용되지 않으셨습니까?
- 20. Amazon MapReduce 감속사 작업 없음
- 21. Hadoop 클러스터에서 mapreduce jar 실행
- 22. couchdb의 키 정렬 및 mapreduce
- 23. hadoop에서 여러 MapReduce 작업 실행
- 24. Amazon Elastic MapReduce 인스턴스 재사용
- 25. App Engine abort mapreduce shard
- 26. hadoop에서 MapReduce 작업 실행 중 콘솔에서 인쇄하는 방법
- 27. AWS MapReduce 용 데이터 준비 및 애프터 케어 방법
- 28. Hadoop에서 디렉토리를 만들고 읽는 방법 - Mapreduce 작업 작업 디렉토리
- 29. MapReduce 작업이 서로 독립적임을 보장하려면 어떻게해야합니까?
- 30. 프로그래밍 방식으로 Hadoop Mapreduce 프로그램 출력 읽기
들으. –
정렬 기술의이 스위치는 표준 하이브리드 정렬 AFAIK입니다. IntroSort라고하는 : http://en.wikipedia.org/wiki/Introsort –