일부 Redshift 쿼리 결과를 S3에로드하려고합니다. 지금까지 내가 pandas_redshift를 사용하고 있지만이 붙어있어 여기Python이 Redshift에서 S3으로 데이터를로드합니다.
import pandas_redshift as pr
pr.connect_to_redshift(dbname = 'dbname',
host = 'xxx.us-east- 1.redshift.amazonaws.com',
port = 5439,
user = 'xxx',
password = 'xxx')
pr.connect_to_s3(aws_access_key_id = 'xxx',
aws_secret_access_key = 'xxx',
bucket = 'dxxx',
subdirectory = 'dir')
을 내가 S3에 덤프 할 데이터 경우 : DF가 성공적으로 생성 된
sql_statement = '''
select
provider,
provider_code
from db1.table1
group by provider, provider_code;
'''
df = pr.redshift_to_pandas(sql_statement)
하지만 다음 단계를 수행하는 방법 이 데이터 프레임을 S3에 저장하는 것입니까?