2016-07-07 3 views
0

두 개의 배열 Array1 (1, 2, 3) 및 Array2 (4, 5, 6)가 있다고 가정합니다. 새로운 Array3 ((1,4), (2,5), (3,6))과 결합하고 싶습니다. Spark에서 그걸 시도하면됩니다.어떻게 Spark에서 병렬 배열로 두 개의 배열을 결합 할 수 있습니까?

코드

val data1 = Array(1, 2, 3, 4, 5) 
val data2 = Array(2, 3, 4, 5, 6) 
val distData1 = sc.parallelize(data1) 
val distData2 = sc.parallelize(data2) 

val distData3 = distData1 ++ distData2 
distData3.foreach(println) 

출력

1 
2 
3 
4 
5 
6 

어떻게 올바르게 결합 할 수 있습니다?

// 업데이트 *

내 프로그램에 (예제와 다른). label.zip (기능)을 사용하고 싶습니다. 내 기능은 다음과 같은 기능입니다. Array [String] 및 My label도 Array [String]입니다. 왜 효과가 없을까요?

<console>:98: error: type mismatch; 
found : org.apache.spark.rdd.RDD[Array[String]] 
required: scala.collection.GenIterable[?] 
+0

정확한 코드를 게시 하시겠습니까? 이 코드는 올바르지 않습니다. distData3.foreach (println)을 수행하고 출력을 얻을 수 없습니다. – eliasah

답변

0

분포가 다른 경우가 data1.zip(data2)하지만이 작동하지 않습니다 수 있습니다.

관련 문제