2014-03-26 1 views
0

DW 개념 및 SSAS 입문. 나는 정규화 된 관계형 dbs가 많은 단일 트랜잭션 배치의 전형적인 작업량으로 인해 OLTP에 대해 최적이라는 것을 많이 읽고있다. 그리고 비정규 화는 일반적으로보고에 사용되는 쿼리의 성격이 일괄 처리 기반이기 때문에 DW/BI 응용 프로그램의 경우 더 일반적입니다 ... 지금 당장 기억하지 못하는 다른 이유가있었습니다.SSAS - 3 곳의 데이터?

비정규 모델을 만들고 기본 관계 모델에서 채우고 비정규 모델에서 큐브를 작성하라는 조언이 나오는 것처럼 들립니다. MOLAP 저장소 유형을 사용한다고 가정하면 큐브는 다차원 모델로 데이터를 저장하고 증분 업데이트합니다.

이제 우리는 본질적으로 동일한 데이터를 세 번 저장했습니다!

나는 그 권리를 읽고 있습니까? 왜 우리는 중간 역 정규화 테이블이 필요한 것일까 요? 보고서 쿼리는 다차원 SSAS 데이터 저장소에 대해 실행되므로 보고서 쿼리를 최적화 할 수 없습니다. 왜 정의가 기본적으로 관계형 데이터베이스의 뷰인 dsv에 대해 큐브를 작성하지 않는가?

답변

1

다차원 모델은 데이터를로드하기 위해 스타 스키마 (즉, "비정규 화 모델"이라고하는)에서 사용할 수있는 관계형 모델이 필요합니다. 또한 여러 소스에서 데이터를 결합하고 OLTP 세계에서 필요한 것보다 더 오랫동안보고 할 데이터를 유지하는 것과 같은 기존의 지역 또는 부서 구조와 같은 내역보기를 필요 없으며 따라서 덮어 쓸 수 있도록 유지하는 것과 같은 일부 처리가 있습니다 OLTP 세계에서. 따라서이 중간 단계는 많은 경우에 적합합니다. 당신은 또한 시간의 명확한 삭감을 원할 수도 있습니다. 이자형. 완전한 날짜 (또는 경우에 따라 수개월) 동안 데이터를 항상보고하고 마지막 날짜에 사용할 수있는 데이터가 없거나 그렇지 않은 데이터를보고합니다. 따라서 e를 비교하는 것보다 하루 동안 숫자를 쉽게 비교할 수 있습니다. 지. 어제 하루 종일의 판매로 최대 10 시까 지의 데이터 만 포함하는 오늘의 판매.

일부 간단한 경우 중간 관계형 데이터 구조를 물리적으로 사용할 필요는 없습니다. 며칠 전 스타 스키마가 원본 데이터에 대한 일련의보기 인 프로토 타입 큐브를 준비했습니다. 물론이 경우 데이터는 원본 소스 형식과 큐브에서 물리적으로 만 사용할 수있었습니다. 원본 데이터의 구조로 인해보기가 비효율적으로되지 않으므로 큐브에 대한 데이터로드가 프로토 타입에 충분히 빠릅니다.