2011-04-14 3 views
0

스테이징 테이블은 dw에있는 목표 테이블의 열 일치에 의한 정확한 열이어야한다고 읽었습니다. 그렇다면 스테이징 테이블을 채운 후에 후속 조회를 수행하여 차원 테이블의 키와 키를 일치시키는 것이 가장 좋습니다.데이터가 준비 테이블에 들어가기 전에 테이블 키 조회를 처리해야합니까?

제 질문 저는 데이터가 준비 테이블에 들어가기 전에 차원 테이블 키 조회를 처리해야합니까?

+0

내가 묻는 이유는 스테이징 테이블이 채워질 때까지 조회를 지연하면 다른 출처에서 가져올 때 반복 조회를 피할 수 있다는 것입니다. 비용은 내 스테이징 테이블이 대상 테이블과 정확히 일치하지 않으며 삽입하기 전에 채워진 정보의 열을 갖게됩니다. – bep

답변

2

스테이징 데이터를 변경하지 않는 것이 가장 좋지만 메타 데이터 열을 추가 할 수있는 것은 아닙니다. 스테이징 데이터가 완벽하게 추적 가능하고 변환되지 않은 소스로 돌아갈 수있는 한 원하는 경우 대리 키 또는 다른 ETL 관련 데이터 (예 : 추출 시간)를 추가 할 수 있습니다.

데이터웨어 하우징의 일반적인 방법은 준비 데이터를 그대로 (추출) 채우고 SCD로 업 사이징 할 때 차원 키를 조회하는 것입니다. 준비 데이터는 여러 목적으로 사용될 수 있으므로웨어 하우스 관련 정보를 포함하지 않아야합니다.

0

내가 어디에서 읽었는지 알고 싶습니다. 어렵고 빠른 규칙은 없지만 대부분의 스테이징 테이블은 필수 소스 데이터의 원시 덤프이며 때로는 기본 클린싱이 수행됩니다. 이 시점에서 데이터웨어 하우스에 대한 조회를 수행하는 것이 좋습니다. 조회는 준비에서웨어 하우스로 데이터를 이동할 때 프로세스에서 수행되어야합니다.

관련 문제