2014-02-14 2 views
0

여러 파일에서 데이터를 추출하고 데이터베이스에 업로드하는 변환을 만들려고합니다. 데이터베이스에는 원본 이름과 파일 경로가 들어있는 2 개의 필드가있는 테이블이 있습니다. 필자는 레코드에서 파일 경로를 추출하고 정보를 추출하여 결과를 추출하고 결과 테이블에 업로드해야합니다. 하나의 레코드에 대해서는이 작업을 수행 할 수 있지만 여러 레코드에 대해서는 수행 할 수 없습니다. 루프를 구현하여 레코드를 읽고 데이터를 추출하는 방법이 있습니까?Pentaho를 사용하여 여러 파일에서 데이터 추출

+0

감사합니다. Brian. 불행히도 나는 그 단계를 따라 갔고 하나의 입력 파일 만 있다면 제대로 작동합니다. 반면에 2 개 이상의 파일이 있으면 고장이납니다. 또한, 내가하려고하는 일은 열 수는 다르지만 동일한 파일 형식의 여러 파일에서 데이터를 가져 오는 것입니다. – user3310850

+0

파일 형식이 다른 경우 'ETL 메타 데이터 삽입'단계를 살펴야합니다. –

답변

1

대부분의 파일 기반 PDI 입력 단계를 사용하면 "이전 단계에서 파일 이름을 수락"할 수 있습니다. 입력 내용이 동일한 유형의 파일 (많은 파일)에서 나오는 경우 사용자 요구에 맞아야합니다.

파일이 모두 동일한 유형 또는 유형 인 경우 사용자가 말한 적이 없으므로 모든 유형이 같고 유형이 CSV/TXT라고 가정합니다. 경험.

그런 경우 Table input 단계를 추가하고 파일 이름이있는 테이블의 내용을 선택하십시오. 그것을 Text file input step에 연결하고 Accept filenames from previous steps 체크 박스를 확인하십시오. 그런 다음 Step to read filenames from 상자에 입력 한 표 이름을 선택하고 Field in the input to use as filename 상자에서 입력란 이름을 선택하십시오.

그런 다음 파일 형식에 따라 텍스트 파일 입력을 구성하십시오. 모든 파일이 동일한 형식을 따르는 한 그렇게해야합니다.

내 가정이 올바르지 않은 경우 의견을 통해 알려 주시면 Google에서 할 수있는 일을 알아 보겠습니다.