저는 x와 y가 실수 인 데이터웨어 하우스에서 y에 대해 x에 대한 차트 (플롯)의 과학 데이터를 저장하는 데 관심이 있습니다.스타 스키마의 차트 데이터 모델링
각 차트는 전통적인 스타/스노우 플레이크 스키마로 모델링 할 수있는 고정 된 설명 차원 (예 : 시간, 날짜, 위치, 장비)에 대해 생성됩니다.
예를 들어, 각도와 검출기의 응답을 말하며, 여기서 angle은 독립 변수이고 응답은 종속적입니다. 여기 각도는 0 ~ 360도 사이의 실수 일 수 있습니다.
필자는 현재 실제 값을 치수로 사용하여 angle_dimension 테이블에 적절한 스케일 (예 : 3dp)로 0에서 360까지의 값을 미리 채우고 필요할 경우 측정 된 결과를 반올림하지만 손실이 발생한다고 생각합니다 정밀도.
OLAP 큐브에서 나중에 사용할 수 있도록이 데이터를 저장하는 더 효과적인 방법이 있는지 궁금합니다. 내가 할 수있는 쿼리 유형은 다른 시간대의 차트 데이터를 비교하여 변경 사항을 찾거나 다른 위치 또는 지정된 장비에서 지정된 범위 (0-15도)의 평균 응답을 확인하는 것입니다 .
세부 정보 데이터 또는 요약 데이터를 보시겠습니까? 세부 정보 데이터를 분석하려는 것 같습니다. 큐브는 그다지 좋지 않습니다. 예상되는 기록의 수를 아십니까? 각도와 관련하여 몇 가지 다른 속성이 있습니까? 차원 모델링에는 적합하지 않습니다. 현재 데이터가 저장되어 있으며 문제는 무엇입니까? –
두 가지를 모두 사용할 수 있기를 원합니다. 목표는 평균값을보고 세부 사항으로 드릴 다운하여 사물이 허용 오차를 벗어나는 이유를 알아낼 수있게하는 것입니다. 현재 샘플링 시간 (0.25 초 간격)에 대한 차트로 생성 된 장비의 매개 변수 (약 20 개이지만 수백 개로 확장 될 수 있음)를 저장하고 있지만 각도의 함수로 다양 할 수도 있습니다. 우리는 몇 가지 비슷한 장비를 가지고 있으며, 각각 2 ~ 3 가지 모드로 작동합니다. 장비는 XML로 차트를 생성합니다. – adam
필자는 선반 OLAP 도구 (Pentaho 커뮤니티)를 사용하여 사용자가 사용자 지정 코드를 작성하는 대신 데이터를 조작 할 수 있도록 양식에 데이터를 배치하려고했습니다. 그것은 현재 더 많은 원칙의 증거입니다, 나는 약 7 백만 레코드가있는 간단한 큐브를 가지고 있습니다. – adam