2014-02-26 2 views
1

저는 DataWarehousing의 초보자입니다. 우리는 분기 별 데이터를로드하는 스타 스키마 설계 인 데이터 마트를 작성했습니다. 우리는 해당 분기에 비즈니스가 승인 한 시점에서 현재 데이터를로드했습니다.데이터웨어 하우스 - 사실 테이블에 이력 데이터 저장

이제 Google은 기록 데이터 (약 3 년 동안 약 40GB)를 다시로드해야합니다. 이 데이터를로드하기위한 차원은 qaurterly로드에 사용 된 것과 동일합니다. 그러나이 실행 기록 데이터를 동일한 사실 테이블에로드 할 수 있습니까? 아니면 복제 사실 테이블을 작성하여 실행 기록 데이터 만로드 할 수 있습니까? DW 표준인가요? 나는 표준에 따라 이것을하는 방법을 찾고있다.

현재 팩트 테이블은 데이터가로드 된 분기를 지정하는 load_cycle_date에서 날짜 파티션입니다.

감사합니다.

+0

DW에는 과거의 집계 된 데이터가 포함되어 있습니다. 우려되는 점은 무엇입니까? – rano

+0

안녕하세요. RanoMy 우려는 과거 데이터 (3 년간 통합)를 분기 데이터를로드하는 데 사용한 동일한 팩트 테이블에로드 할 수 있는지 여부입니다. – user3357452

+0

향후 3 년 동안 분기 별 데이터 만 삽입한다고 가정하면 변경 될 내용은 무엇입니까? – rano

답변

0

이전 데이터를 가져오고 이전 load_cycle_dates를 사용하는 것이 기존 테이블에 맞지 않는 이유가 없습니다. 이 형식으로 변환 할 수 있다고 가정합니다. 이것은 데이터 구조가 몇 년 동안 변화했는지에 근거합니다.

  1. 귀하의 모든 치수에 대한 충분한 역사적 가치가 있는가 : 당신이로 볼 필요가 다른 지역이

    입니까? 예 : 고객 등급. "나쁜"등급으로 끝난 고객이있을 수 있지만 이전에는 그렇지 않았습니다. 각 변경 사항에 대한 기록이 있어야합니다. 대안은 백업에서 데이터를 가져 오는 것입니다.

  2. 승인 프로세스 - 시작될 때까지 많은 데이터 불일치가 종종 발견되지 않습니다. 그 결과로 이러한 수정을하는 앱이 변경되었을 수 있습니다. 일부 보고서는이 "이전 데이터웨어 하우스"데이터로 실행되며 정확하지 않을 수 있습니다.

1 분기 동안이 작업을 수행하지 말아야 할 이유가 없습니다. 그것은 당신이 확실히 알 수있는 유일한 방법입니다. 현재 작업중인 데이터웨어 하우스는웨어 하우스가 시작되기 전에 데이터를 추가하는 동일한 프로세스를 거쳤습니다. 전환은 매우 일반적입니다.

관련 문제