2016-11-11 3 views

답변

0

스파크가 자동으로 잃어버린 파티션을 다시 계산합니다.

+0

감사합니다. Simon. 그러나 일부 블로그에서 RDD의 파티션을 잃어버린 경우 해당 파티션에서 변환을 재생해야한다고 읽었습니다. 그 맞습니까? –

+0

노드가 8 개인 클러스터에서 코드를 실행할 때. 그러면 RDD가 배포됩니다. 이제 노드를 잃어 버릴 수도 있습니다. 해당 노드에서 RDD의 파티션이 손실됩니다. 개발자는이 사건을 처리 할 필요가 없습니다. Spark은 손실 된 파티션을 다른 노드에서 자동으로 재 계산 (재생)합니다. 그러나 입력 데이터는 모든 노드에서 사용 가능해야하며, hdfs에서 복제되거나 nfs를 사용하여 마스터 노드에서 사용 가능해야합니다. –