2010-07-03 3 views
2

파티셔닝 데이터 세트에 대한 커스텀 파티셔너를 작성했습니다. 같은 파티션을 사용하여 두 개의 데이터 세트를 분할하고 다음 mapreduce 작업에서 각 맵퍼가 두 소스의 동일한 파티션을 처리하고 결합 등의 일부 기능을 수행하기를 원합니다. 한 맵퍼가 두 소스에서 같은 파티션에 해당하는 분할?Parititioned Data Map/Reduce

도움을 주시면 감사하겠습니다.

답변

0

설명하는 것은지도 측 결합의 변형입니다. Pro Hadoop 또는 org.apache.hadoop.mapred.join의 제 8 장