2015-01-09 2 views
0

나는 Cassandra 데이터베이스의 데이터 집계를위한 우아한 솔루션을 찾고 있습니다. (문제는 카산드라의 쿼리로 그룹을 운영하는 것처럼 간단합니다.)Apache Cassandra의 데이터 집계 (그룹화)

우리 애플리케이션에서 우리는 고객 로그인 기록을 카산드라 테이블에 저장하고 있습니다 (빠른 쓰기 속도와 높은 TPS 지원의 명백한 이점을 위해) 현재 우리는 이 데이터 위에 분석 대시 보드를 개발해야합니다. 이 요구 사항의 경우 데이터 집계가 필요하며 이는 카산드라에서 직접 사용할 수 없습니다.

우리는 Cassandra 위에 Apache Solr을 사용하는 옵션을 평가했습니다. 두 가지 접근법 : Solandra 사용 또는 DataStax 사용. Solandra 프로젝트는 더 이상 개발 단계가 아니며 프로덕션 환경에서는 사용할 수 없습니다. Datastax EE는 무료가 아닙니다 (마지막 옵션으로 만 사용됩니다).

우리의 문제에 대해보다 쉽고 우아한 해결책이 있다면 알려주십시오.

미리 감사드립니다.

+0

소규모 회사 인 경우 DSE를 무료로 사용할 수 있습니다. datastax.com/startup – phact

답변

2

DataStax Spark Cassandra Connector와 함께 Apache Spark를 사용하십시오. 카산드라 노드에서 Spark 작업자를 실행하면 지역 인식을 얻게됩니다. 스파크 (Spark)는 카산드라 (Cassandra) 분석 기술의 핵심 요소가되고 있습니다.

+0

빠른 응답을 보내 주신 Ashic에게 감사드립니다. Cassandra와 Spark의 통합에 관한 몇 가지 지침/링크를 더 제공 할 수 있습니까? 또한 Datastax 스파크가 자유롭게 사용하거나 어떤 가입을 포함하는 경우 pls는 지금 나를 보냅시다. –

+0

Apache Spark는 Apache 프로젝트입니다.) DataStax Spark 커넥터는 무료이며 오픈 소스입니다. https://github.com/datastax/spark-cassandra-connector – ashic

+0

멋집니다! 따라서 Cassandra와 스파크를 통합하여 데이터 집계 (그룹화) 쿼리를 실행할 수 있습니다. 그렇지 않으면 불가능합니다. 다시 한번 감사드립니다. –