AWS의 S3 서비스에 gzip으로 압축 된 CSV 파일이 포함 된 버킷이 있지만 저장되었을 때 모두 메타 데이터 Content-Type of text/csv로 저장되었습니다.AWS EMR이 S3의 파일을 압축 해제하도록 강요합니다.
이제 AWS EMR을 사용하고 있습니다. AWS EMR을 압축 파일로 인식하지 않고 압축을 풉니 다. EMR에 대한 구성 옵션을 살펴 보았지만 작동하는 것은 보이지 않습니다 ... 거의 백만 개의 파일이 있으므로 메타 데이터 값의 이름을 바꾸려면 모든 파일을 순환시키고 메타 데이터 값의 이름을 바꾼 Boto 스크립트가 필요합니다.
나는 쉽게 찾아 볼 수 있습니까? 감사!