쪽모 세공 파일 저장 장치를 사용할 때 하이브 파티션을 만들면 어떤 이점이 있습니까? 마루 (parquet)는 모든 열이 색인별로 순차적으로 저장되는 열 청크에 데이터를 저장하는 원주 형 저장 파일 형식입니다. 술어를 기반으로 열을 선택 쿼리 할 때 선택 열 인덱스는 술어를 기반으로 필요한 범위로 점프하고 값을 인쇄합니다. 파티셔닝이 어떻게 도움이 될까요? 행 지향형 하이브 테이블에서는 지정된 필수 범위의 데이터 만 히트 할 것이기 때문에 파티셔닝이 도움이됩니다. 그러나이 방법은 마루 저장에 도움이 될 것입니다.쪽모 세공 파일 저장 장치를 사용할 때 하이브 파티션을 만들 때의 이점
1
A
답변
0
파티션되지 않은 테이블에서 하이브는 테이블의 데이터 디렉토리에있는 모든 파일을 읽은 다음 필터를 적용해야합니다. 대형 테이블의 경우 속도가 느리고 비용이 많이 듭니다. 파티션 테이블에서 파티션 열을 기반으로 하위 디렉터리를 만듭니다. 실행로드를 가로로 분산하므로 단일 레코드에 대해 전체 테이블 열을 검색 할 필요가 없습니다. 쪽매 파일 형식은 압축률은 높지만 성능은 좋지 않습니다. 마루가있는 파티션은 parquet 테이블에서 필터 쿼리를 실행했을 때 query.eg.when의 실행 시간을 줄여 주는데, 마루 포맷의 파티션은 14.21 초가 걸리는 반면 29.657 초 걸렸습니다. 큰 테이블이 있으면 확실히 쿼리 성능이 향상됩니다 .
관련 문제
- 1. EventHandler를 사용할 때의 이점
- 2. IEquatable을 사용할 때의 이점
- 3. MongoDB에서 directoryperdb를 사용할 때의 이점
- 4. Solaris에서 Java를 사용할 때의 이점
- 5. RelayCommand 개체를 사용할 때의 이점
- 6. XOP에서 MTOM을 사용할 때의 이점
- 7. Query Builders를 사용할 때의 이점
- 8. nServiceBus SendOnly를 사용할 때의 이점
- 9. HashSet에서 HashMap을 사용할 때의 이점
- 10. EncodePointer/DecodePointer를 사용할 때의 이점
- 11. 하이브의 시퀀스 파일 형식과 쪽모 파일 형식은 무엇입니까?
- 12. 아파치 하이브 파티션을 식별하는 방법
- 13. Android의 원격 프로세스에서 서비스를 사용할 때의 이점
- 14. ServiceStack MemoryCacheClient를 통해 System.Runtime.Caching을 사용할 때의 이점
- 15. 일반 QWidget보다 QOpenGLWidget을 사용할 때의 이점
- 16. MVC에서 안정적인 서비스를 사용할 때의 이점
- 17. 애플릿에서 log4j 또는 logback을 사용할 때의 이점
- 18. UMA 기계에서 MPI를 사용할 때의 이점
- 19. Selector가있는 TextView에서 버튼을 사용할 때의 이점
- 20. 안드로이드에서 64 비트 커널을 사용할 때의 이점
- 21. CustomAdapter에 대해 CursorAdapter를 사용할 때의 이점
- 22. 여러 개의 FIX 게이트웨이를 사용할 때의 이점
- 23. 부정적인 열거 형을 사용할 때의 이점
- 24. SQLAlchemy와 함께 psycopg2를 사용할 때의 이점
- 25. 여러 AWS 계정을 사용할 때의 이점
- 26. 'ng-include src'를 사용할 때의 이점
- 27. spark 데이터 프레임을 쪽모 세공 형식으로 쓸 때 메모리 부족 오류가 발생했습니다.
- 28. 프로세스 ID를 확인할 때 WaitForSingleObject를 사용할 때의 이점
- 29. 하이브 테이블에서 파티션을 비교할 수있는 이유는 무엇입니까?
- 30. 잠금 장치를 사용할 때의 고려 사항