2013-10-16 4 views
0

Fanus와 함께 그래프 데이터 모델에 Titan을 사용할 계획입니다.타이탄 - 카산드라 및 푸시 알림

데이터 저장소 선택 - 카산드라가 확실한 선택 인 것처럼 보이지만 아직 데이터 저장소를 결정하지 않았습니다. Titan을 다른 데이터 저장소로 벤치마킹 한 사람 있습니까? 푸시 알림 : 클라이언트에 대한 순회 응답을 푸시해야합니다. Node.JS (이벤트 기반) 또는 Vaadin (오브젝트 기반)에 대한 모든 사례 연구? 감사합니다.

답변

2

나는 Cassandra가 300 만 가지 보험 정책에 최적이라고 생각하여 중형 규모의 P & C 보험 회사에 Titan을 실험했습니다 (큰 소리가 나기 때문에). 나는 Berkeley와 PersistIt이 더 잘 맞았다는 사실에 놀랐다.

키 테이크 웨이 : 각 백엔드에는 강점이 있으며 데이터 세트의 특성에 따라 이러한 강점을 비교해야합니다.

버클리와 PersistIt 10-100s 만 꼭지점 그래프의

실용 제한 : 여기에 간단한 요약입니다. 그러나, 같은 크기의 그래프의 경우, 모든 데이터가 동일한 JVM 내에서 로컬로 액세스 될 수 있기 때문에 두 스토리지 백엔드 모두 높은 성능을 발휘합니다. 균일 그래프 접근 읽기 주로 부하 탁월

Hazelcast

낮은 대기 시간 최적화 대안. 참고로 Hazelcast는 영구 지속성을 제공하지 않습니다. 이 백엔드의 이상적인 그래프는 하나 또는 여러 대의 컴퓨터에서 완전히 메모리에 맞을 수 있습니다. 또한이 스토리지 백엔드가 비용 효율적이기 위해서는 대부분의 그래프에 정기적으로 액세스해야합니다.

HBase를하고 카산드라이 백엔드는 (정점 수십억 수백 억) 큰 그래프위한 물론

. 일반적으로 중소 규모의 그래프에서는 Berkeley 나 PersistIt보다 성능이 우수합니다. 둘 사이의 선택은 Consistent-Partitionable 시스템 (HBase)과 Available Partitionable 시스템 (Cassandra) 중 하나의 선택입니다.

또한 반 구식 CAP 이론의 관점에서 이것에 대해 생각할 수 있습니다 :

https://github.com/thinkaurelius/titan/wiki/images/titan-captheorem.png