take(5)
을 다른 RDD로 호출 한 후 반환 된 컬렉션을 변환하려면 어떻게해야합니까? 출력 파일에 처음 5 개의 레코드를 저장할 수 있습니까?Spark : scala - RDD에서 다른 RDD로 컬렉션을 변환하는 방법
saveAsTextfile
을 사용하는 경우 take
과 saveAsTextFile
을 함께 사용하지 않게됩니다. (그 이유는 아래에서 그 줄을 주석으로 표시 한 이유입니다). RDD의 모든 레코드를 정렬 된 순서로 저장하므로 처음 5 개 레코드가 상위 5 개 국가이지만 처음 5 개 레코드 만 저장하려는 경우 - RDD에서 콜렉션 [take (5)]을 변환 할 수 있습니까?
val Strips = txtFileLines.map(_.split(","))
.map(line => (line(0) + "," + (line(7).toInt + line(8).toInt)))
.sortBy(x => x.split(",")(1).trim().toInt, ascending=false)
.take(5)
//.saveAsTextFile("output\\country\\byStripsBar")
솔루션 : 당신이 절대적으로 saveAsTextFile
서식을 필요로하지 않는 sc.parallelize(Strips, 1).saveAsTextFile("output\\country\\byStripsBar")