2012-04-27 3 views
2

저는 카스 산드라를 내 프로젝트로 평가하고 있으며 수백만 행의 열 패밀리가있는 기본적인 카산드라 스키마 디자인의 실현 가능성을 알고 싶습니다. 각 행의 상한선은 30,000 개입니다. 분산 된 카산드라 클러스터 (5-10 노드)를 구현할 수있는 설계입니까? 아니면 뭔가 빠졌습니까?카산드라 스키마 디자인 실행 가능성

또한 한 트랜잭션에서 단일 행의 모든 ​​열을 검색 할 수 있는지 알고 싶습니다. 이 작업을 수행하려는 이유는 사용자에게 반환하기 전에 값으로 정렬하는 것입니다.

답변

6

수백만 열 패밀리가 현재 카산드라에서 실행 가능하지 않습니다. 최근 버전의 상한선은 수천에 달합니다. 또한 설명 된 데이터 세트 (수백만 cfs x 수백만 행)는 최소 1 조 행을 나타냅니다. 물론 클러스터의 특성에 따라 다르지만이 행 수/데이터 양은 5-10 노드보다 훨씬 큰 클러스터가 필요합니다. 카산드라는 매우 크고 강력한 노드에 반대하는 많은 중간 크기의 노드로 훨씬 나아졌습니다.

모든 열을 즉시 검색하는 것과 관련하여 기본 최대 요청 크기는 15MB입니다. 이것은 변경 될 수 있지만 거의 변경하지 않으려 고합니다. JVM 에서처럼 큰 할당이 어렵 기 때문에 쿼리가 최대 요청에 접근해서는 안됩니다. 하나의 거래에 있어야하는 이유가 있습니까? 몇 가지 요청에서 행을 쉽게 넘겨서 모든 열을 가져온 다음 그 시점에서 정렬 할 수 있습니다.

+0

답변 해 주셔서 감사합니다. 필자의 원래 게시물부터 수천 개의 열이있는 수백만 개의 열이있는 몇 개의 열 패밀리로 좁혀졌습니다. 최대 쿼리 크기에 대한 정보는 매우 유용합니다. 가능한 한 많은 행을 서버에 대한 왕복을 최소화하기 위해 한 번에 가져 오려고했습니다. –