0
나는 내 프로젝트를 위해 스파크를 배우고 있는데, 나는 스파크의 셔플 과정에 박혀있다. 이 작업이 내부적으로 어떻게 작동하는지 알고 싶습니다. 나는이 작업에 관련된 몇 가지 키워드를 발견 ShuffleMapStage, ShuffleMapTask, ShuffledRDD, 셔플 쓰기, 셔플 읽기 .... 스파크 셔플 작동 원리
내 질문
은 다음과 같습니다1) Why we need ShuffleMapStage? When this stage is created and how it works?
2) When ShuffledRDD's compute method is called?
3) What are Shuffle Read and Shuffle Write?