2009-12-04 2 views
10

앞으로 프로젝트를위한 스토리지 플랫폼을 평가 중이며 계속 Cassandra로 돌아오고 있습니다. 이 프로젝트를 위해 데이터의 양을 용인 할 수 없습니다. 지금까지는 관계형 데이터베이스 (Microsoft SQL Server)를 사용했지만 데이터가 매우 다양하고 저장 및 쿼리하는 데 문제가되었습니다.카산드라는 기본 데이터 저장소로 사용하기에 적합합니까?

Cassandra는 기본 데이터 저장소로 사용할만큼 견고합니까? 또는 액세스 속도를 높이기 위해 기존 데이터를 미러링하는 데만 사용해야합니까?

답변

9

Anecdotally : 예, 트위터, 디그, Ooyala, SimpleGeo, Mahalo 및 기타는 Cassandra를 사용하여 기본 데이터 저장소 (http://n2.nabble.com/Cassandra-users-survey-td4040068.html)를 가져 왔습니다.

기술적으로 : 예; 복제 지원 (여러 데이터 센터 포함) 외에도 각 Cassandra 노드에는 쓰기가 내구성을 유지할 수 있도록 fsync'd 커밋 로그가 있습니다. 거기에서 쓰기는 압축 (그것은 여러 SST를 GC 이전 버전에 결합 함)까지 불변 인 SSTables로 변환됩니다. 스냅 샷은 압축 전 자동 스냅 샷을 포함하여 언제든지 지원됩니다.

+0

Digg와 Facebook에 대해 알고 있었지만 얼마나 성숙했는지 알지 못했습니다. 감사! –

3

응용 프로그램에 Cassandra를 사용할지 여부는 데이터 작업량에만 의존합니다. Cassandra는 쓰기 집약적 인 작업 부하에 최적화되어 있으므로 많은 양의 데이터를 삽입해야하는 응용 프로그램 (예 : Facebook의 인프라 로깅 정보)에 적합합니다.

그러나 빠른 검색과 삽입 속도가 필요하지 않은 경우 HBase (읽기 집약적 인 작업 부하에 최적화되어 있음)를 살펴보아야합니다.

관련 문제