2010-01-21 5 views
0

OLAP을 처음 사용합니다.OLAP DB에서 데이터가 지워지는시기는 언제입니까?

테이블 구조와 ETL 프로세스를 이해합니다.

데이터가 사실 테이블에서 삭제되어야 할 때 나는 이해가 안됩니다. 이벤트 용보고 응용 프로그램을 만들고 있다고 가정 해 보겠습니다. 각 이벤트에는 완료까지 걸린 시간, 종료 코드 및 읽은 총 바이트 수가 있습니다. 여러 가지 특성 항목이 있습니다 (예 : 시간과 장소.

매일 1 백만 개의 새 레코드가 내 사실 테이블에 준비되어 있습니다. 총 1GB입니다. 내 ETL 프로세스가 사실 테이블에 데이터 만 추가하는 경우 무한정 커집니다. 팩트 테이블에서 데이터를 언제 삭제해야합니까? 데이터를 여러 팩트 테이블 (예 : 월별 테이블)로 나누어야합니까?

어림짐작이 있습니까?

감사합니다.

답변

1

기록을 삭제해서는 안됩니다.

마침표.

그러나 하루에 1Gb가 3 년마다 1Tb가 될 수 있다는 사람들이 있습니다. 이것은 거의 문제가되지 않지만 일부 사람들은 여전히 ​​스토리지 가격에 대해 걱정하고 싶어합니다.

데이터 삭제를 디자인하는 데 소요되는 시간은 저장하려고하는 저장 공간보다 비쌀 수 있습니다.

[3 DBA와 2 명의 프로그래머가 몇백 개의 MB를 절약하는 방법에 대해 토론했습니다. 나는 그들 모두를 Best Buy로 몰아 넣고 500Mb 디스크 드라이브를 내 차 바닥에 여분의 교체로 구입할 것이라고 말했다. 논의하기 위해 방 안으로 들어가는 컨설턴트 5 명은 이미 "저장"하려고 시도한 스토리지의 가격을 이미 초과했습니다.]

"우리가 요약 할 수 있습니까?" 전적으로 사용자에게 달려 있습니다. 간혹 유용하게 요약 할 수 없기 때문에 쉽게 삭제할 수 없습니다.

일부 사람들은 비즈니스주기가 20 년 또는 그와 비슷한 것으로 말할 것이며, 처음 20 년 (7Tb)에 대한 세부 정보와 그 이전의 기간에 대한 요약을 원합니다.

+0

는 완벽한 기억하는 놀라운 현상에 http://www.amazon.com/Delete-Virtue-Forgetting-Digital-Age/dp/0691138613 삭제 외모를 "역사는 삭제하지 말아야" 디지털 시대를 맞이하고 왜 우리가 잊을 수있는 역량을 다시 도입해야 하는지를 드러내고 있습니다. 디지털 테크놀로지는 예전과 같이 우리에게 힘을 실어 주지만, 예상치 못한 결과를 초래합니다. 미래의 고용주가 볼 수 있도록 사이버 공간에 잠재적으로 모욕을주는 Facebook 콘텐츠가 모셔져 있습니다. Google은 검색 한 모든 내용을 언제든지 기억합니다. 디지털 영역은 때로는 더 잘 잊어 버린 것을 기억하며, 이것은 심오한 implicati을 가지고 있습니다. –

+0

젠장. 이 사이트에서 댓글 서식이 끔찍합니다. –

+2

나는이 OLAP이 Facebook에서의 술취한 대학 사진과 비교할 만하다고 생각하지 않습니다. –

1

파티션을 사용하여 이전 레코드를 처리하고 파티션을 다른 드라이브로 이동할 수 있습니다. 팩트 테이블을 날짜 (월 분기, 년)별로 분할하면 모든 실제적인 목적을 위해 거의 대부분 최신 파티션에 거의 액세스하지 않습니다.

DW는 IT가 아닌 비즈니스 사용자에게 속합니다. 비즈니스 분석가가 물어볼 수있는 질문 (DW 쿼리)을 제한하지 마십시오 (가정하지 마십시오).