나는 카산드라에 3 개의 테이블을 몇 개의 노드로 묶어 놓고 각각의 테이블 위에 앉아있다. 테이블 A, B, C를 호출 할 수 있습니다.카산드라 스파크 Datastax 복제본
A와 B는 큽니다 만 동일한 파티션 키를 가지고 있기 때문에 데이터를 결합 할 때 데이터 지역이 유지됩니다.
이제 다른 파티션 키가 있지만 다른 두 테이블만큼 큰 것은 아닌 다른 테이블 C에 가입하려고합니다. 또한해야한다면 테이블을 모든 노드에 복제 할 준비가되었습니다.
최소 셔플을 사용하여 데이터 지역성을 유지하면서 함께 가입하는 방법은 무엇입니까?
감사합니다. 데이터가 그렇게 크지 않기 때문에 방송에 참여하기로했습니다. 나는 당신의 대답을 upvote 15 담당자가 없어, 미안 해요. – daviddecoding