BigQuery 쿼리가 오래 걸리는 이유를 이해하려고합니다.__SHUFFLE1_REPARTITION0의 BigQuery 속도 -
Explanation
의 출력을 해석하는 데 대한 몇 가지 게시물이 있지만이 경우 진행 상황을 이해하는 데 도움이되는 내용이 없습니다.
__PSRC___SHUFFLE2_0
에서 읽는 것과 __SHUFFLE2_REPARTITION0
에 쓰는 것이 왜 오래 걸릴지에 대한 의견이 있으십니까? 이 파티션을 새로운 키로 다시 파티션합니까? 이전 단계, (13), 또한 현재 70 %가이 단계에 소요되는 우리의 데이터의 샘플에 200S 정도 걸립니다이 HASH($290)
에 의해 작성되었습니다 있지만. (
(그럴 수 없어 도움이 경우 내가 편집 됨 버전을 게시 할 수 있지만, 여기에 전체 쿼리를 게시 할 수 있습니다.)
2 단계와 5 단계는 흥미 롭습니다. 2 단계는 2M 행에서 7M으로 진행되며 5 단계는 140M 출력과 함께 10M 행을 얻습니다. 조인이 폭발적이라고 생각합니다. 쿼리되는 데이터의 크기는 얼마입니까? –