0
두 개의 배열 Array1 (1, 2, 3) 및 Array2 (4, 5, 6)가 있다고 가정합니다. 새로운 Array3 ((1,4), (2,5), (3,6))과 결합하고 싶습니다. Spark에서 그걸 시도하면됩니다.어떻게 Spark에서 병렬 배열로 두 개의 배열을 결합 할 수 있습니까?
코드
val data1 = Array(1, 2, 3, 4, 5)
val data2 = Array(2, 3, 4, 5, 6)
val distData1 = sc.parallelize(data1)
val distData2 = sc.parallelize(data2)
val distData3 = distData1 ++ distData2
distData3.foreach(println)
출력
1
2
3
4
5
6
어떻게 올바르게 결합 할 수 있습니다?
// 업데이트 *
내 프로그램에 (예제와 다른). label.zip (기능)을 사용하고 싶습니다. 내 기능은 다음과 같은 기능입니다. Array [String] 및 My label도 Array [String]입니다. 왜 효과가 없을까요?
<console>:98: error: type mismatch;
found : org.apache.spark.rdd.RDD[Array[String]]
required: scala.collection.GenIterable[?]
정확한 코드를 게시 하시겠습니까? 이 코드는 올바르지 않습니다. distData3.foreach (println)을 수행하고 출력을 얻을 수 없습니다. – eliasah