문제 : 라이브러리를 인증하거나 사용하지 않고 Amazon의 자체 클러스터에서 AWS S3 버킷으로 저장하려고합니다. 기본적으로 Amazon 클러스터에서 실행되는 프로그램의 데이터를 S3 버킷에 저장하려고합니다.Amazon Web Service s3에 파일 저장
아마존 웹 서비스 (AWS) EMR 클러스터에서 일부 Python3 프로그램을 실행 중이고 AWS S3 버킷의 폴더에 파일을 저장하려고하는데 해당 폴더가 없으면 만들고 싶습니다.
현재 파일을 저장하는 방법은 다음과 같습니다. 나는 with
메서드를 시도했으나 작동하지 않습니다.
rdd.saveAsTextFile("s3://mybucket/")
가 인증없이 saveAsTextFile()
일을 하는가 또는 어떻게 든 인증 않습니다 제공하는 인증없이 점화 RDDs의 방법을 사용하여 작동하는 S3 버킷에 part-xxxxx
파일로 RDD를 저장하는 몇 가지 이유를 들어
output = open("s3://mybucket/myfile.txt", "w+")
output.write("hello world\n")
, 백그라운드에서?
아마존의 클러스터에서 S3 버킷에 파일을 저장하는 인증이 필요하지 않은 경우 saveAsTextFile()
RDD 방법과 같은 인증을 요구하지 않고 Python의 open
메서드를 사용하여이 작업을 수행 할 수 있습니까?
s3n (원시 s3 파일 시스템)은 현재 s3a가 사용되는 위치에서 사용되지 않습니다. Spark 2.0에서 s3a 1을 사용하려면 다음 등록 정보를 구성해야합니다. fs.s3a.access.key 2. fs.s3a.secret.key 3. org.apache.hadoop.fs.s3a.S3AFileSystem –