2012-09-25 3 views
0

나는 아래의 설정을 thirft 서버가 HBase를 실행에하둡 HBase를 쿼리

2 노드의 Hadoop/HBase를 클러스터 있습니다.

Hbase에는 1,000 만 개의 행이있는 테이블이 있습니다.

나는 웹 (차트 목적)에 표시하도록 HBase를 테이블 에 합계와 같은 집계 쿼리()를 실행해야합니다.

지금은 파이썬 (쓰리 프 클라이언트)을 사용하여 데이터 세트 및 표시를 얻고 있습니다.

웹에서 사용할 데이터베이스 (hbase) 레벨 집계 함수를 찾고 있습니다.

의견이 있으십니까?

답변

0

이것은 일반적으로 맵 축소 작업입니다. 하이브를 사용하여 SQL에 쿼리를 작성하는 것과 같은 방법을 사용할 수 있습니다. https://cwiki.apache.org/Hive/hbaseintegration.html

+0

웹 페이지에 표시 할 실시간 쿼리를 찾고 있습니다. – user1697574

+2

HBase는 키를 기준으로 행을 검색하는 실시간을 지원하기 때문에 합계를 사전 계산하는 것이 더 좋으며 무엇을 가지고 HBase에 결과를 저장하는 것이 좋습니다. – MattMcKnight

0

피닉스 하이브에 비해 HBase를 테이블에서 낮은 지연 시간 결과에 대한 좋은 솔루션입니다. 2 차 인덱스와 SkipScan을 사용하기 때문에 Hbase 스캐너보다 범위 스캔에 적합합니다. 귀하의 경우와 마찬가지로 Python을 사용하고 phoenix API에는 JDBC 커넥터 만 있습니다.

다른 Hbase Coprocessors를 사용해보십시오. SUM, MAX, COUNT, AVG의 기능은 다음과 같습니다. 테이블을 만드는 동안 보조 프로세서를 사용할 수 있으며 보조 프로세서 기능을 사용할 수 있습니다.

ODBC 커넥터 인 JDBC 커넥터를 제공하는 Impala를 사용할 수 있습니다. Impala는 대용량 병렬 배치 실행을 위해 하이브 metatable을 사용합니다. Hbase 테이블에 대해 Hive 메타 테이블을 만들어야합니다.