2016-07-20 2 views
2

이것은 개념 증명이며 Riak-TS를 사용하여 Riak-TS를 평가 한 경험에 대해 궁금합니다.Riak-TS UseCase vs other tsdb

일부는 다양한 데이터의 그래프/차트를 표시하는 데 사용되는 모바일 앱에서 작업 중입니다. 이 데이터는 상업용 프린터, 고객에게 전달되는 작업 및 정보를 사전 처리하고 다양한 메트릭의 스냅 샷을 가지고 있지만 현재는 실시간으로 만 사용할 수 있으므로 과거 데이터를 분석하기위한 tsdb 구현을 검토 중입니다.

나는 30 ~ 60 초 간격의 시계열 데이터를 수집하고 표시 할 데이터를 사용하는 Riak-TS를 사용합니다

: 시간/교대/일/주 인쇄 작업의

번호/등 잉크 사용 시간/시프트/요일 등 특정 시간 범위에서 데이터의 합/평균/시리즈 스냅 샷과 관련된 다양한 기타 데이터.

Riak-TS를 사용할지 여부를 결정할 때 고려해야 할 몇 가지 사항과 잠재적 인 단점에 대해 생각해보십시오.

이 케이스의 기본적인 개념 증명 설정을 위해 Riak을 사용하려면 얼랭 레벨이 필요합니다. 저는 파이썬과 자바 스크립트에 상당히 익숙하며, 리크 (Riak)와 같은 언어로 작업 할 수있는 것처럼 보였습니다. 그러나이 프로젝트를 설정하기 위해 얼랭 (Erlang)을 배울 시간이 없었습니다.

파이썬, Node.js, HTTP 인터페이스가 사용하기 쉽고 빠르며 더 많은 기능 등에서 눈에 띄는 차이가 있습니까? 몇 가지 클라우드 서비스에서 일부 인터페이스가 누락되거나 버그가 있거나 느린 기능을 가지고 있으며 최선의 기능을 사용할 계획을 세우고 있습니다. Java, C# 또는 Go 인 경우 해당 정보에도 관심이 있습니다.

Riak-TS 이외의 다른 오픈 소스 구현을 탐색해야합니까?

답변

2

처음에는 홍수 때 Riak TS의 좋은 유스 케이스처럼 들립니다. TS를 사용하는 것에 결점이 있습니까? 어쩌면 내가 주목할 것 중 하나는 당신이 얼마나 많은 데이터를 다루어야하는지 말하지 않았다는 것입니다. Riak TS는 처음부터 클러스터되도록 설계되었으며 고 가용성 이유로 인해 5 노드 클러스터로 시작하는 것이 좋습니다. 필요에 따라 단일 노드로 시작하고 수평 확장 할 수 있지만이를 수행하면 TS 플랫폼의 장점 중 일부가 없어집니다.

TS는 아직 공개되지 않았으며 경쟁사의 모든 기능을 아직 가지고 있지 않을 수도 있음을 지적 할 것입니다. (단, 팀원 및 Basho에 대한 전체 공개는 추가 릴리스를 위해 노력하고 있습니다. 새로운 기능).

얼랭에. TS를 사용하려면 Erlang을 알아야합니다. 당신이해야 할 일을 위해 Erlang을 배울 필요가 없습니다.

Riak TS 용 Python 클라이언트는 훌륭합니다. 나는 그것을 자바 클라이언트에 광범위하게 사용했다. 나는 다른 엔지니어들도 같은 그룹의 엔지니어와 클라이언트 소프트웨어에 의해 작성되고 관리되기 때문에 다른 클라이언트도 꽤 훌륭하다고 생각할 것입니다. 클라이언트 소프트웨어는 그들의 전문 기술입니다.

HTTP API를 통해 클라이언트를 사용하는 것이 좋습니다 (파이썬, 노드, Java 등). 클라이언트가 프로토콜 버퍼 및/또는 TTB를 사용하기 때문에 성능이 향상 될 수 있으므로 HTTP API를 통해 클라이언트를 사용하는 것이 좋습니다. HTTP와 비교.

다른 데이터베이스를 사용해보십시오. 이 질문의 제목에서 TSDB를 언급합니다. 제 경험상 TSDB는 시작하고 실행하기가 훨씬 더 어렵습니다. InfluxDB는 현재 가장 인기있는 시계열 데이터베이스입니다. 나는 개인적인 경험이 없지만 그 인기로 꽤 좋다고 추측합니다.

유스 케이스는 꽤 재미있어 보였습니다. (인쇄 업계에서 일한 적이 있습니다.) 다른 도움이 필요하시면 알려 주시기 바랍니다.

+0

감사합니다. TS의 공개 소싱이 나를 끌어 당겼습니다. 데이터의 양은 개념 증명을 위해 30 초마다 서버를 폴링하고 단일 인스턴스의 경우 각 프린터에 대해 약 30 개의 데이터 필드가있는 10-20 개의 프린터에 대한 데이터, 다양한 단계의 최대 3000 개의 작업 (아마도 개념 증명을 위해 200 개 미만의 작업) 각 작업에 약 50 개의 데이터 필드가 있고 인쇄 작업 전처리와 관련된 데이터 필드가있을 수 있습니다. 많은 데이터가 (프린터 모델과 같은) 각 타임 스탬프에서 정적이되지만 잉크 잔량 같은 것들은 훨씬 더 동적으로 변할 것입니다 – Jinw