MapReduce 작업 (특히 관련 Hadoop)을 작성하려면 map()
및 reduce()
함수를 정의해야하며 둘 다 일련의 키/값 쌍을 생성해야합니다. 키 및 값의 데이터 유형은 응용 프로그램에서 자유롭게 정의 할 수 있습니다.동일한 유형의 키/값 쌍을 map() 및 reduce()로 반환해야합니까?
단어 계산의 표준 예제에서 두 함수는 모두 (string, int)
유형의 쌍을 생성하며 키는 단어이고 값은 발생 횟수를 나타냅니다. 여기에 내가 본 다른 모든 예제와 마찬가지로 출력 된 키와 값 유형이 두 함수간에 일관성이 있습니다.
map()
및 reduce()
에 의해 생성 된 키/값 쌍의 유형은 MapReduce의 모든 응용 프로그램 내에서 동일해야합니까? 그렇다면 : 왜?