1
S3 버킷에 데이터 프레임을 업로드해야하지만 버킷에 대한 삭제 권한이 없습니다. S3에서이 _temporary 디렉토리를 만들지 않도록 할 수있는 방법이 있습니까? 어쩌면 spark에서 _temporary 디렉토리에 로컬 FS를 사용한 다음 최종 결과 파일을 S3 버킷에 업로드하거나 _temporary 디렉토리를 완전히 피할 수 있습니다.S3에서 _temporary 디렉토리를 생성하지 마십시오.
미리 감사드립니다.
hdfs에 대한 분할 된 쓰기 동안 비슷한 동작을 보입니다. 즉 df .write.partitionBy (keys) .parquet ('/ location') 다른 대안이 있습니까? – autodidacticon
작업이 병렬로 실행될 수 있고 다시 시도하여 오류가 수정 될 수 있도록 임시 디렉터리가 사용됩니다. rename()은 HDFS에서 빠르고 원자 단위이므로 걱정할 필요가 없습니다. –