0

나는 하나 개의 데이터베이스 (포스트 그레스)에서 데이터를 가져 오는거야 시나리오를 가지고에서 데이터를 검색하고 다른 데이터베이스의 테이블에 데이터를로드 (Redshift에)펜타 주전자 - 다른 데이터베이스

주전자에 어쨌든 거기 이 직업을 예약 하시겠습니까?

그 적색 편이 일괄 삽입에 대해 최적화 될 때,하지 행 단위 삽입 아파 느릴 수 테이블 출력 단계를 사용 insert into redshift select * from postgres

+0

테이블 입력 (포스트 그레스에 연결) -> 테이블 출력 (적색 변이에 연결). 필요한 경우 사이에 데이터 유형을 조정하십시오. – simar

+0

아마존 redshift 용 jdbc 드라이버를 가져 와서 $ KETTLE_HOME/lib에 복사하십시오. – simar

답변

1

간단한. AFAIK, Redshift에 벌크 삽입을위한 주전자에는 단계/플러그인이 없습니다.

    포스트 그레스에서
  1. 덤프 데이터 S3에
  2. 복사합니다 데이터를 파일로 : https://anotherreeshu.wordpress.com/2015/11/30/loading-data-to-aws-s3-bucket-pentaho-data-integration/
  3. 이 Redshift에로 S3에서 데이터를 삽입합니다 : 당신이 할 수있는 일, 그 쉘 단계에서 스크립트를 만드는 것입니다 https://anotherreeshu.wordpress.com/2015/12/11/loading-data-from-s3-to-redshift-pentaho-data-integration/