2016-09-20 3 views
0

두 개의 RDD가 있습니다. rdd2의 일부 값이 rdd1의 키와 동일한 경우두 개의 RDD를 스칼라 스파크의 값으로 결합합니다.

rdd1 = (문자열, 정수)

(a, 10) 
(b, 15) 
(c, 20) 
(d, 20) 
(e, 13) 

rdd2 = (문자열, 문자열)

(1, a) 
(2, b) 
(3, e) 

, 어떻게처럼 그들을 병합 할 수 있습니다 이하? 가능한가?

(1, 10) 
(2, 15) 
(3, 13) 

답변

1

보십시오 : 그것은 작동하지 않습니다

rdd1.join(rdd2.map(_.swap)).values 
+0

. 그것은 '기호 결합을 해결할 수 없습니다'라고 말합니다. 왜 그런지 알고 있습니까? – tobby

+0

아마도'rdd1'은 RDD가 아닙니다. –

+0

오, 그래 맞아! RDD가 아니라 위와 같은 형식을 가지고 있다고 생각합니다. 그런 다음 병합 할 다른 제안 사항이 있습니까? – tobby

관련 문제