2011-07-26 2 views
4

스타 스키마와 스노우 플레이크 스키마의 기본적인 차이점을 알고 있습니다. 스노우 플레이크 스키마는 차원 테이블을 정규화하기 위해 여러 테이블로 나누기 때문에 스타 스키마에는 차원 테이블의 "수준"이 하나만 있습니다. 그러나 Snowflake 스키마에 대한 Wikipedia article에 의하면눈금 스키마는 데이터 마이닝의 스타 스키마보다 낫습니까?

"기존의 다차원보고 도구를 사용하여 간단한 스타 스키마 내에서 표현할 수없는 쿼리를 데이터베이스에 제출하려는 사용자가있을 수 있는데, 이는 고객 데이터베이스의 데이터 마이닝, 일반적인 기준은 복잡한 기준을 충족하는 제품을 구입 한 고객들 사이에 공통적 인 요소를 찾는 것입니다. 특히 일부 눈송이는 간단한 쿼리 도구로 이러한 쿼리를 작성할 수 있어야합니다. 특히 데이터가 창고가 처음 설계되었습니다. "

동일한 기본 데이터에 대해 눈송이 스키마에 작성 될 수있는 쿼리를 스타 스키마에 작성할 수없는 경우는 언제입니까? 스타 스키마가 항상 동일한 쿼리를 허용하는 것처럼 보입니다.

답변

6

데이터 마이닝의 경우 데이터를 거의 항상 하나의 "플랫 테이블"로 준비해야합니다.

쿼리, 준비된보기 또는 CSV 내보내기 일 수 있습니다. 도구 및 사용자 환경 설정에 따라 다릅니다.

이제 기사를 제대로 이해하려면 작성자와 똑같은 것을 마셔야 할 것입니다.

0

언급했듯이 관계형 데이터베이스에서 시작하여 데이터 마이닝을위한 플랫 테이블을 준비하는 것은 간단한 작업이 아니며 스노우 플레이크 또는 스타 스키마는 한 지점에서만 작동합니다.

그러나 DB에서 플랫 테이블을 자동으로 만드는 Dataconda이라는 소프트웨어가 있습니다.

기본적으로 관계형 데이터베이스에서 대상 테이블을 선택하고 dataconda는 수천 개의 새 특성을 추가하여 데이터를 "확장"합니다. 이러한 속성은 여러 테이블과 관련된 복잡한 쿼리를 실행하여 얻을 수 있습니다.