hadoop 클러스터에 상당히 큰 하이브 테이블 (~ 200 억 레코드)이 있습니다. 여러 조인을해야합니다.하이브로 인덱싱
키에 대해이 테이블을 인덱싱 할 수 있습니까? 예를 들어, 표 3 및 테이블 테이블 이름은 표 내가 여러가 표 2와 표 조인을 수행하려는 경우 열에 4 이 작업을 수행하는 가장 효율적인 방법 일 것입니다 무슨 키 ?
관련 테이블 2-4은 상대적으로 매우 작은 경우 (~ 1 억 각)은 표 1에 매우 높은 선택성이있는 경우에만 색인이 경우에 도움이 될 것입니다