최근에 나는 책을 읽고 있었다. hadoop : 그 부분이 두 클러스터 인 명확한 가이드는 distcp을 사용하여 데이터를 복사한다. 나는 "데이터 크기가 매우 클 때지도의 수를 제한해야한다. 대역폭과 클러스터 활용을 제한하기 위해 "왜 맵 수가 증가하면 hadoop의 대역폭과 클러스터 활용도가 영향을 받습니까?
나는 그 의미를 알 수 없다? 우리는 클러스터의 효율성을 높이기 위해 대역폭을 최대한 넓혀야한다고 생각합니다. 그렇다면 왜지도의 수를 제한해야합니까?