2011-12-13 3 views
2


탄성 탄 기억 저장을 위해 다중 노드
컴퓨터 네트워크 (Linux PC의 내부 서브넷)에 이르는 B + 트리를 구축하고 싶습니다. 범위 스캔이 중요합니다.분산 네트워크 B + trees

기본적으로
분산 DB 시스템의 기본 데이터 구조입니까? (카산드라, HBase)

분산 된 B + 나무에 대한 연구가 있습니까?
나는
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
에서 문서를 보았지만한데, btree 단지 결함 노드를 꺼내 건너 뛰기 (그래서 데이터 손실있다)

내가 가진 B + 나무에서 특히 관심이 내장 된 중복
(즉, 만약 호스트가 실패하고 모든 노드가 호스트가 오프라인,
나는 기본 노드에게
서버가 실패한 호스트의 장소) 내가 컬렉션을 사용하지 않으

을 다른 복제 호스트를하고 싶습니다 DB ins 섀시로
(1 노드, 하나의 DB) 대용량 확장 스토리지 시스템 (
x86, OS x64 하드웨어 x64 하드웨어)에 대해서는
이 적합하지 않습니다.

나는 바퀴를 다시 발명합니까?
Cassandra 또는 HBase를 사용해야하나요?

답변

2

카산드라는 범위 쿼리를 지원합니다.

Google의 Big Table은 기기를 켜면 자동으로 클러스터에 새로운 기기를 추가합니다. 그것은 매우 탄력적이고 기계를 더 추가하기 쉽습니다. 유감스럽게도 그 속도에는 단점이 있습니다. 쿼리가 매우 제한적입니다. 일부 범위 쿼리를 수행 할 수 있습니다. 데이터가 빅 테이블에 저장하는 방법을 http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

좋은 예 : http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

좋은 스택 오버플로 게시물 : storing massive ordered time series data in bigtable derivatives

목록과 자세한 내용은이 문서를 참조하십시오
관련 문제