2012-02-29 5 views
0

복제 계수가 3 인 HBase 클러스터가 있습니다. 읽기 성능을 향상시켜보다 많은 '초당 잡을 수 있도록 노력하고 있습니다.HBase 및 스케일링 읽기

벤치 마크를 받으면 (읽는 중) htable 풀을 사용하여 HBase에 대한 연결을 설정하고 테이블에 연결합니다. 그런 다음 반복적으로 동일한 행을 반복적으로 읽고 클러스터로드를 모니터링했습니다. 클러스터의 모든 노드는 동일한 하드웨어를 사용합니다. 내가 알아 차린 것은 단일 노드의 CPU로드가 올라 갔을 때입니다. 내가 3 배의 복제 인수로 클러스터를 구성 했으므로 단일 노드의 단일 복사본이 아닌 모든 데이터 복사본에서 읽기가 수행된다고 가정합니다 (3의로드 증가가 예상됩니다) 서버가 아니라 하나).

Get 쿼리가 3 개의 복제 된 데이터 집합간에 균형을 이루고 단일 노드에서 읽히지 않도록 읽기 성능을 향상시키는 방법은 무엇입니까?

감사

답변

1

3의 복제 요소는 기본 HDFS 블록 3 회를 복제하지만, 각 HBase를 영역 그래서 하나의 행은 한 장소에서 제공 될 수 있으며, 하나의 HRegionServer에서 제공되는 것을 의미한다.

+0

그건 내 두려움이었습니다. 해명 해줘서 고마워. – Tucker