2015-01-19 3 views
0

나는 초보자부터하지.하이브 테이블이 더 나은 성능을 제공합니까?

내부 테이블 : 테이블이 하이브웨어 하우스에 저장되고 삭제 된 경우 메타 데이터와 데이터가 모두 삭제됩니다. 외부 테이블 : 테이블이 hdfs에 저장되고 삭제 된 경우 메타 데이터 만 삭제됩니다. 지금 쿼리하는 동안 성능이 더 좋은 테이블이 있습니까? 이유를 알려주십시오.

또한 실시간으로이 테이블에 대해 더 많은 차이를 줄 수있는 경우 매우 유용합니다. 사전에

감사합니다.

답변

0

내부 테이블과 외부 테이블간에 성능 차이가 전혀 없습니다. 유일한 차이점은 당신이 언급 한 것과 같습니다. 하이브 창고가 HDFS (경로가 다름)에 있습니다.

+0

고맙습니다 ....이 표를 실시간으로 좀 더 알려주시겠습니까? 시나리오. –

+0

대부분의 시나리오에서 외부 테이블을 사용하는 것이 좋습니다. 데이터 파일이 공유 하이브 창고 대신 각 사용자의 작업 영역에 저장되기 때문에 클러스터 관리자는 클러스터가 다른 사용자가 공유하는 경우 ACL 및 HDFS 할당량을 쉽게 관리 할 수있는 이점을 얻습니다 . – zhutoulala

관련 문제