나는 계량 된 데이터를 분석하는 데 도움이되는 OLAP 응용 프로그램을 계획하고 있으며 저장된 값이 다른 각도 (시간, 소스)에서 보일 것이므로 데이터베이스에 대해 일종의 스타 스키마를 갖게 될 것입니다. , 유형 등) 요청은 이러한 차원을 따라 집계 된 데이터를 요청할 것입니다. 쿼리는 많은 행을 전달하는 경향이 있습니다 (최대 약 100,000 개).비트 맵 인덱스를 "가짜"로 만드는 것이 합리적입니까?
이 주제에 대한 연구 (my question here 참조)는 비트 맵 색인이 내가 계획하고있는 방식으로 데이터를 검색하는 좋은 방법임을 나타냅니다. 그러나, 나는 복수의 db 엔진을 지원하고자하는데, 그 중 일부는 테이블 (특히 MySQL)에 비트 맵 인덱스를 제공하지 않습니다.
이제 필자 만의 비트 맵 인덱스를 만들고 유지 관리하여 팩트 테이블을 가리키는 행 ID를 찾을 수 있습니다. 그러나 데이터베이스가 여전히 B-Tree에서 행 ID를 검색 할 것이기 때문에 이것이 인덱스의 모든 목적을 무력화시킬 것으로 생각됩니다. 더 심오한 이론적 배경이나 더 많은 경험을 가진 누군가가 치수 표에서 느린 결합을 할 필요가없는 것과 같이 여전히 무엇인가 얻으면 알려 줄 수 있습니까?
답이 간단하지 않은 경우 평가해야 할 사항에 대한 힌트를 주시면 감사하겠습니다.
suppo rt 비트 맵 인덱스를 사용하려면 모든 데이터베이스에 대해 가장 낮은 공통 분모를 사용하지 말고 사용하는 것이 좋습니다. –