아파치 스파크를 처음 사용하기 때문에 아파치 스파크에서 mergesort 용 자바 코드를 작성해야합니다.아파치 스파크를 사용하는 Mergesort
SparkConf conf = new SparkConf().setMaster("local").setAppName("Merge Sort App");
JavaSparkContext sc = new JavaSparkContext(conf);
JavaRDD<Integer> input = sc.parallelize(a); // where a is list of Integers
나는 javaRDD<Integer>
에 정수의 로딩 배열 목록을 수행하고있다 :
나는 아파치 스파크와 megersort를 사용하여 정렬하는 정수 요소 목록을 사용해야합니다.
도움이 필요하십니까?
왜 병합 정렬입니까? 진짜 이유가 있니? 그렇지 않다면, 그냥 sortBy 자바 함수 –
으로 갈 수 있습니다. RDD를 정렬해야한다면, 표준'sortBy()'메소드를 사용하는 것이 어떻습니까? 여기 [link] (https://spark.apache.org/docs/2.0.2/api/java/org/apache/spark/api/java/JavaRDD.html)에서 설명을 찾을 수 있습니다. –
또한 정수 목록이 작고 메모리에 적합하면 Spark 사용을 피할 수 있습니다. –