0
안녕하세요 2 개 요소와 JavaRDDPair이 : 나는 2를 결합해야스파크 - 가입 2 PairRDD 요소
("TypeA_B", List<jsonCombinedAPlusB>)
:
("TypeA", List<jsonTypeA>),
("TypeB", List<jsonTypeB>)
내가 형의 1 쌍에 2 쌍을 결합해야 목록에 1 개씩 나열됩니다. 각 2 개의 jsons (1 개 유형은 A, 1 개는 B 유형)에는 내가 가입 할 수있는 공통 필드가 있습니다.
A 형의 목록을 고려
은 다른보다 훨씬 작고, 내부해야 가입, 그래서 결과 목록은 유형 A의 목록 작게해야가장 효율적인 방식은 무엇입니까 그렇게?
OP는 구문에 대해 묻지 않고 성능에 대해 묻지 않았습니다. 즉, b.join (a)보다 더 효율적인 a.join (b) – ihadanny