2011-08-25 3 views
7

cassandra에 이러한 제한이있는 경우 노드 당 최대 스토리지가 될 수있는 것과 같은 노드 하드웨어 사양의 제한 사항이 있는지 찾고 있습니다.cassandra 노드 제한

좋은 듀얼 제온 프로세서를 사용하여 노드 당 48TB 스토리지 (2TB x 24 하드 드라이브 7200rpm) 노드를 사용하려고합니다.

존재하는 경우 이러한 제한 사항을 찾았지만이 문제에 대해 어떤 자료도 찾지 못했습니다. 그리고 기사와 블로그의 대부분은 0.6v에만 관련된 반면, 최근에는 카산드라에 대한 소문이 너무 적어서 성숙기에 올라가고 0.8 버전까지 올라갔습니다.

답변

7

카산드라는 행별로 데이터를 배포하므로 단 하나의 노드가 한 노드에 적합해야한다는 단점이 있습니다.

짧은 대답은 아니오입니다.

더 긴 대답은 영구 데이터와 커밋 로그에 대해 별도의 저장 영역을 설정해야한다는 것입니다.

명심해야 할 한 가지 다른 점은 여전히 ​​속도 문제를 찾으려는 것입니다. Cassandra에 대한 좋은 점 중 하나는 많은 양의 데이터가있는 단일 노드를 가질 필요가 없다는 것입니다. 실제로 실제로 잘 알려지지 않았기 때문에 스토리지가 처리 능력을 능가합니다. 더 작은 노드 (하드 드라이브 공간이 현명한 경우)를 사용하면 저장 및 처리 기능이 함께 확장됩니다.

+0

그것의 좋은 점.스토리지 및 처리 전력 비율에 대한 좋은 생각이 있습니까? 필자는 총 16 개의 32 스레드 코어를 듀얼 제온 7560으로 사용하고자했습니다. –

+0

내가 말할 수없는 달콤한 곳. 그러나 고려해야 할 또 다른 요점은 복제 요소입니다. RF> = 2 인 노드를 3 개 이상 가질 계획입니까? 그렇지 않으면 카산드라 혜택을 피할 수 있습니다 (최고의 실패 지점이 아닙니다). – dmcnelis

+0

그래, 동일한 크기와 RF> = 2의 노드가 3 개 이상있을 것입니다. btw 또한 카스 산드라의 복제 작업을 크게 줄이면 RAID10과 같은 대체 옵션을 사용하는 것에 대해 듣고 싶습니다. –

5

는 노드 당 1 ~ 10TB는 재치있는 사이, 응용 프로그램에 따라 제안 How much data per node in Cassandra cluster?

참조하십시오. Cassandra는 아마 48TB에서 작동 할 것이지만 최적은 아닙니다.

복제 계수 1 또는 2를 사용 하시겠습니까? (위에 언급 한 것처럼 2 개의 노드가있는 경우)?

단일 노드의 많은 데이터로 인해 일부 작업 (복구, 압축)이 매우 느릴 수 있습니다.

+0

만약 내가 각 노드를 10TB라고 말하기 위해 깨면, cassandra가 모든 것을 멋지게 처리하기 위해 어떤 CPU/RAM이 이상적이어야 하는가? 64TB RAM을 48TB 스토리지와 함께 사용하기 위해서는 열 인덱스 만 유지해야하기 때문입니다. –

+2

http://wiki.apache.org/cassandra/CassandraHardware의 RAM에 대한 일부 의견 - 사용중인 키 캐시 또는 행 캐시 및 읽기/쓰기 작업 부하에 따라 많은 영향을받습니다. 고도의 명목으로 지정된 몇몇 노드보다 하드웨어가 적은 노드를 더 많이 사용하면 더 나은 결과를 얻을 수 있습니다. – DNA

7

대용량 데이터 세트 고려 사항에 대한 참고 사항은 here입니다.

노드 당 48 TB의 데이터가 너무 많습니다. 적은 양의 데이터로 더 많은 노드를 갖는 것이 훨씬 낫습니다. 주기적으로 기계의 모든 데이터를 읽는 것과 관련된 nodetool repair을 실행해야합니다. 많은 테라 바이트의 데이터를 컴퓨터에 저장하는 경우 매우 어려울 것입니다.

각 노드는 약 1TB의 데이터로 제한됩니다.

5

또한 Cassandra와 함께 많은 양의 RAM을 사용하는 데주의해야합니다. RAM은 SSTables에있는 데이터를 캐싱하는 데는 좋지만 JVM을 너무 많이 사용하면 힙 공간을 많이 사용하는 것은 비생산적입니다. JVM에 12GB 이상의 힙 공간을 제공하지 마십시오. 그렇지 않으면 가비지 수집이 너무 오래 걸리고 성능이 저하됩니다. 이것이 더 작은 노드를 갖는 것이 카산드라에서 더 좋은 또 다른 이유입니다. 주요 공급 업체이다