저는 하둡과 하이브 세상을 처음 접했습니다.사용 가능한 모든 노드에서 하이브 맵 렌더링 작업을 실행하는 방법?
나는 189 백만 행 (40GB 파일)을 처리하는 하이브 쿼리를 작성했습니다. 쿼리를 실행하는 동안. 하이브 쿼리는 단일 시스템에서 실행되고 많은 맵 및 작업을 생성합니다. 그것은 예상 된 행동인가?
많은 문서에서 읽었습니다. Hadoop은 분산 처리 프레임 워크입니다. 내가 이해하고 있던 것은 하둡이 여러 작업으로 작업을 분할하고 다른 노드에서 작업을 배포하고 일단 작업이 완료되면 감속기가 출력에 참여하게됩니다. 내가 틀렸다면 나를 바로 잡아주세요.
1 개의 마스터 노드와 2 개의 슬레이브 노드가 있습니다. Hadoop 2.2.0과 Hive 0.12.0을 사용하고 있습니다.