2014-09-08 2 views
2

하이브의 인덱스와 파티션의 인덱스는 어떻게 다릅니 까? 둘 다 내 지식에 따라 쿼리 성능이 향상되고 어떤 점에서 차이가 있습니까?하이브의 인덱스와 파티션

색인 또는 분할을 사용하는 상황은 무엇입니까? 함께 사용할 수 있습니까?

친절

답변

0
partition: 

당신이 당신의 응용 프로그램에서 만든 테이블 유지 트랜잭션을 가지고 생각해 좋습니다. 이 테이블은 날이 갈수록 날이 갈수록 커집니다. 일 간격을 기준으로이 테이블을 분할하면 데이터베이스는 매일 간격과 같이 테이블을 생성하지만 하나의 테이블 만 볼 수 있습니다. 그것은 귀하의 일기 기본 쿼리를보다 효과적입니다.

색인. 색인은 테이블 레코드에 빠르게 액세스하는 데 사용됩니다.

1

파티션을 사용하면 사용자가 쿼리를 실행할 때 검색 할 파일 수를 최소화하여 다른 HDFS 디렉토리에 저장된 데이터 파일을 저장할 수 있습니다 (선택한 매개 변수를 기반으로 데이터 파일을 날짜별로 저장하려는 경우).

인덱스를 사용하면 데이터를 빠르게 가져 오는 데 도움이되지만 인덱스를 사용하려면 인덱싱 할 데이터가 저장된 인덱스 테이블이 필요합니다. 이로 인해 데이터가 두 번 저장됩니다.