DirectFileOutputCommitter는 Spark 2.2.0에서 더 이상 사용할 수 없습니다. S3에 쓰는 것은 아주 오래 걸린다 (3 시간 대 2 분). 나는스파크 2.2.0 FileOutputCommitter
스파크-SQL 작동하지 않습니다 같은spark-shell --conf spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version=2
spark-sql --conf spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version=2
위의 명령이 될 것으로 보인다, 이렇게함으로써 스파크 쉘에서 2 FileOutputCommitter 버전을 설정하여이 문제를 해결할 수 있어요 버전 = 2로 설정했지만 쿼리가 실행되면 버전 1 동작을 계속 표시합니다.
두 질문에,
1) 어떻게 스파크-SQL과 FileOutputCommitter 버전이 동작을받을 수 있나요?
2) Spark 2.2.0에서 DirectFileOutputCommitter를 계속 사용할 수있는 방법이 있습니까? 내가이 문제를 공격 한
Spark 1.6 DirectFileOutputCommitter