아래 코드 블록 간의 성능 차이는 무엇입니까?스파크 flatMapToPair 대 [필터 +지도 투 페어]
1.FlatMapToPair :이 코드 블록은 하나의 변환을 사용하지만 기본적 기술적 따라 진행하도록 RDD이 요소를 허용하지 않는, 빈리스트를 반환 그 안에 필터 조건을 구비한다
rdd.flatMapToPair(
if (<condition>)
return Lists.newArrayList();
return Lists.newArrayList(new Tuple2<>(key, element));
)
2. [Filter + MapToPair]이 코드 블록에는 위의 코드 블록과 동일한 조건을 사용하여 첫 번째 변형을 간단하게 필터링하지만 필터 뒤에 다른 변형 mapToPair를 수행하는 두 가지 변환이 있습니다.
rdd.filter(
(element) -> <condition>
).mapToPair(
(element) -> new Tuple2<>(key, element)
)
관계없이 변환의 개수의 코드 블록이 모두 동일하게 수행 할 정도로 지능적 스파크 이러한 두 변형과 마찬가지로 코드 블록 (2)에 더 수행인가?