2017-11-24 1 views
0
Employee 
Employee Type       : 0130 
Unit         : 4189670095711234 
Basic Salary       : 11.00 
Joined Date       : 04/12/yy 06:30:05 
Country        : 826-United Kingdom 

(123.66)      --- Endof Employee ------------- 

R 4567 ABCD    -> Len f---- i 01/14 

Employee 
Employee Type       : 0120 
Unit         : 4189670095711234 
Basic Salary       : 11.00 
Joined Date       : 04/12/yy 06:30:05 
Country        : 826-United Kingdom 

(123.66)-      --- Endof Employee ------------ 

R 4567 ABCD    -> Len f---- i 01/14 

Employee 
Employee Type       : 0130 
Unit         : 4189670095711235 
Basic Salary       : 11.00 
Joined Date       : 04/12/yy 06:30:05 
Country        : 826-United Kingdom 

(123.66)      --- Endof Employee ------------- 

안녕하세요, talend를 사용하여 구조화 된 데이터에 다음과 같은 반 구조화 데이터를 변환하고 싶습니다는 talend BigData

를 사용하여 구조화 된 데이터에 반 구조화 된 데이터를 변환합니다.

어떻게 데이터를 구조화 된 형식으로 변환하여 관계형 테이블에 삽입 할 수 있는지 알려주십시오.

답변

2


다음은 tPivotToColumnsDelimited 구성 요소 덕분입니다. enter image description here

tFileInputDelimilted은 2 개 필드 스키마 (nammed 속성 및 값)와 연관되는 특별한 필드 분리 갖는다 ":"(우주 공간 콜론).
Avanced 설정 옵션 "Trim all columns"및 "Check each row structure to schema"가 선택됩니다.

TMAP은 "속성"이름 따라 각 입력 라인에 대한 순위를 연결하는 여기에 있습니다 : 당신이 볼 수 있듯이 enter image description here , 시퀀스 이름이 속성 이름에 기반을, 그래서 같은 직원에 대한 각 파일 레코드가있을 것이다 같은 순위 값.

마지막으로 tPivotToColumnsDelimited는 동일한 순위 값을 가진 모든 입력 레코드를 한 행으로 이동하며 가장 중요한 값은 rigth 속성과 관련됩니다. enter image description here "피벗 열"을 "속성"으로, "집계 열"을 "값"으로, "집계 함수"를 "처음"으로 "그룹화"를 "순위"로 설정하십시오. 원하는 출력 파일 이름을 선택하면 원하는 결과를 얻을 수 있습니다. enter image description here

희망이 있습니다.

+0

와우! 그것은 효과가 있었다. 고마워. –

+1

멋지고 독창적 인 대답입니다. –