2016-12-22 2 views
0

내 S3 버킷에는 .xls 파일이 있습니다.이 파일은 그룹화 된 파일로, 처음 20 행에는 이미지가 있고 일부는 클라이언트에 대한 세부 정보를 추출합니다.복사 명령을 사용하여 amazon s3 bucket에서 redshift 테이블을로드하는 방법은 무엇입니까?

먼저 .xls를 .csv로 변환하고 복사 명령을 통해 Redshift 테이블을로드하고 처음 20 행도 무시합니다.

참고 : 내가 그때 성공적으로로드 복사 명령을 통해 Redshift에 테이블을로드하려고 .CSV로 .XLS로 저장 수동으로 실시. 이제 내 문제는 .xls를 Pentaho 작업을 통해 .csv로 변환하는 방법입니다.

+0

에 오신 것을 환영합니다! 질문을 편집하여 달성하려는 것을 설명하기위한 추가 정보를 제공 할 수 있습니까? 예를 들어, 데이터가 생성되는 방법, Amazon S3으로 들어가는 방법, 현재 Amazon Redshift COPY 명령을 호출 할 수 있습니까? 무엇을 시도 했습니까? 어떤 문제가 있습니까? 파일의 형식은 무엇입니까? Amazon Redshift는 구분 된 (예 : CSV), 고정 폭 또는 JSON 파일 형식 만로드 할 수 있습니다. –

+0

@ John 감사합니다 .xls 파일을 pentaho 작업을 통해 .csv 파일로 변환 할 수 없습니까? – Velu

답변

0
당신은 내 두 단계 변환을 사용하여 CSV로 엑셀로 변환 할 수 있습니다

:

  1. Microsoft Excel에서 입력 - 그것은
  2. 텍스트 파일 출력 파일 엑셀에서 행을 읽어야한다 -는 1 단계에서 행을 저장 스택 오버플로 csv 파일에

enter image description here

관련 문제