2013-12-07 1 views
2

우리가 풀려고하는 문제 : 나중에 쿼리 할 수있는 모든 데이터 포인트를 저장하여 웹 서비스의 성능을 추론합니다. 데이터를 시각적으로 표현하십시오. 여기 TSDB와 HBase : 장기간에 선택할 것은 무엇입니까?

지금까지 내가 HBase를과 TSDB 사이트 약간의 표준이 아닌 방법으로

  • TSDB 저장 HBase와 데이터,이기는하지만 (와이드 행 형식)

  • 에 읽은 내용에서 나의 이해입니다
  • TSDB는 엄청나게 빠르며 매우 신속하게 그래프를 추가 할 수있는 방법을 제공합니다.

  • HBDB는 TSDB에 비해 느리지 만 SIMBA ODBC 드라이버를 사용하여 Tableau에 연결할 수 있습니다. 놀라 울 정도로 민첩하고 아름다운 시각적 데이터 표현입니다.

TSDB에 대한 한 가지 더 많은 문제는 현재 HBase .96에서 작동하지 않는다는 것입니다 (tsuna @는 현재 작동하지만 현재 Hbase.96에서 작동하는 tsdb의 안정적인 릴리스에 대한 타임 라인이 없습니다)

간단한 답변은 Hbase 또는 TSDB 일 수 있습니다. 또는 하나 이상의 옵션을 선택하는 대신 답변을 정당화하고 다른 옵션을 선택할 수 있습니다.

1 년 넘게 저장 한 1 조 데이터 포인트를 지원할 수 있다면 다른 솔루션을 사용할 수 있습니다.

답변

1

필자의 솔직한 의견으로는, 데이터를 플로팅해야한다면 OpenTSDB 사용을 고려해야합니다. OpenTSDB가 지속적으로 개발되고 있고 11 월에 RC 2.0 버전이 출시 되었기 때문에 장기간에 더 좋은 점은 확실하지 않습니다. OpenTSDB 포크는 KairosDB이고 Apache Cassandra을 데이터베이스로 사용하므로 포인트를 최대 밀리 초까지 저장할 수 있으며 OpenTSDB를 사용하면 최대 포인트를 초까지 저장할 수 있습니다.

그래서 저는 OpenTSDB/KairosDB와 같은 Timeseries Distributed Databases를 사용하여 데이터를 플로팅하는 것이 좋습니다. 장기적인 문제에 대해 확신하지는 못했지만 어쩌면 오픈 소스 성격으로 인해 다음 달 Hbase에서 더 나은 것이 개발 될 수 있습니다.

1

하둡 생태계에 설정되어있는 경우 Axibase Time-Series Database은 HBase 위에서 실행되는 다른 제품입니다. 우리는 Tableau와의 통합 기능이 없지만 JDBC 드라이버는 2015 년 4 분기에 출시 될 예정이며,이를 통해 SQL과 유사한 쿼리를 통해 시계열 데이터 (원시 및 집계)를 가져올 수 있습니다.

업데이트 2016-05-26 : ATSD 유형 4 JDBC 드라이버는 Apache II 라이센스하에 2016 년 4 월에 릴리스되었습니다. https://github.com/axibase/atsd-jdbc

+0

다른 옵션을 사용하여 hadoop 생태계를 관찰 한 지 몇 년 후, 우리는 하둡 (Hadoop) 오버 헤드로 인해 haddop을 사용하지 않았습니다. DevOp 개발자에게는 큰 문제였습니다. –

관련 문제