저는 데이터웨어 하우스 디자인의 초보자입니다. 나는 어떤 이론을 가지고 있지만 최근에 OLAP 큐브의 디자인에 실질적인 문제를 만났습니다. 스타 스키마를 사용합니다.합계 및 고유 카운트 측정 (별표 스키마 디자인 koan)
차원 지명 :
COUNTRY_NAME
province_name
district_name
치수 장치를 dimension_id
내가 2 개 차원 테이블 1 개 사실 테이블이 있다고 가정하자 : 01 235, 는
device_category
device_subcategory을 dimension_id
사실 테이블 :
가
hazard_id (측정 항목)
area_m2 (측정 항목)
을 device_dimension_id gazetteer_id
하나의 위치 (지명 사전)와 ocuppies X 평방 미터에 "비즈니스 객체"(실제로 지뢰밭 임)가 여러 장치를 가질 수 있습니다.
그래서이있는 장치 카테고리를 알기 위해,이 같은 위험에서 각 장치마다 사실을 만들어 :
+--------------+---------------------+-----------------------+-----------+
| gazetteer_id | device_dimension_id | hazard_id | area_m2 |
+--------------+---------------------+-----------------------+-----------+
| 123 | 321 | 0a0a-502c-11aa1331e98 | 6000 |
+--------------+---------------------+-----------------------+-----------+
| 123 | 654 | 0a0a-502c-11aa1331e98 | 6000 |
+--------------+---------------------+-----------------------+-----------+
| 123 | 987 | 0a0a-502c-11aa1331e98 | 6000 |
+--------------+---------------------+-----------------------+-----------+
내가 hazard_id의 고유 한 카운트 같은 측정 "위험의 수를"정의.
또한 "total area occupied"측정 값을 area_m2의 합계로 정의했습니다.
이제 지명 사전 및 장치를 사용하고 주어진 차원 구성원에 얼마나 많은 위험이 있는지 알 수 있습니다.
그러나 문제는 area_m2입니다 : 합계로 정의되기 때문에 실제 영역보다 n 배 높은 값을 제공합니다. 여기서 n은 위험 객체의 장치 수입니다. 예를 들어, 위의 데이터는 18000m2를 제공합니다.
이 문제를 어떻게 해결할 수 있습니까?
저는 Pentaho 스택을 사용하고 있습니다. 사전에
감사
hazard-id가 지뢰밭이고 gazetter 및 지뢰 크기 별 분석기를보고있는 경우 위험 요소를 포함 할 수있는 위험 치수를 만들 수 있습니다. 또는 DeviceDimension 테이블에서 Null 장치 항목을 만들고 Null 장치 항목 만 area_m2 집합을 가져 오면 실제 장치는 area_m2 = 0을 얻습니다. – Jamie