2014-11-16 6 views
-3

따라서 키 값 쌍이 (SecondName, FirstName) 인 RDD가 있습니다. SecondNameFirstName이라고합시다. 이제는 성으로가는 모든 첫 번째 이름에 대해 (이름, 성) 쌍을 만들고 싶습니다. 이 작업에 참여 하시겠습니까?동일한 RDD의 두 인스턴스를 결합 할 수 있습니까

SecondNameFirstName.join(SecondNameFirstName).map(x => x._2) 

생각은 가입하기 후에, 나는 (SecondName, (FIRSTNAME, 이름))의 키 값 쌍을 가질 것입니다. 이제 두 번째 튜플 만 가져 오면 (이름, 성)의 키 값 쌍이 생깁니다.

+0

'apache-spark'태그를 사용할 수 있습니까? 나는 보통 그것을 교정한다. 그러나 나는 지금 전화 위에있다 – maasg

답변

0

왜 rdd에 가입하는 데 문제가 있습니까? 초기 rdd를 원하는 결과로 매핑하면됩니다.

val firstFirst= secondFirst.map{case (second, first) => (first, first)} 
+0

그것은 succint 다. 어떤 아이디어를 파이썬에서 동일하게 처리 할 수 ​​있을까요? – MetallicPriest

관련 문제