2017-01-10 1 views
1

) Cassandra, BigTable 또는 Hadoop 솔루션을 사용할 가능성을 평가하고자합니다. 이 3 가지가 벤치 마크 테스트에서 어떻게 비교되고 수행되는지에 대한 최신 비교를 제공하는 곳이 있습니까? 아마도 5 년 전부터 몇 가지 사실을 발견했지만 다이빙하기 전에 세 가지 데이터베이스, 즉 강점과 약점에 대한 더 높은 수준의 시각을 얻고 싶습니다.DB 벤치마킹 : Cassandra vs. BigTable vs. Hadoop (

답변

3

YCSB (야후! 클라우드 검색 기준) NoSQL 데이터베이스 성능 테스트의 표준입니다. This presentation은 대기 시간과 확장 성을 테스트하는 YCSB의 목표를 요약 한 것으로 보입니다.

지연 시간과 확장 성 외에도 서버가 적절히 프로비저닝 될 때 높은 일괄 처리로드 및 "온라인"유형 시스템의 테일 대기 시간에 대한 처리량 (즉, 전체 작업 완료)을 확인합니다. 테일 대기 시간이란 내가하는 일을 말합니다. 얼마나 빨리 요청이 1 % (또는 .1 %) 느린지를 말합니다.

Cloud Bigtable put out some YCSB results (처음 출시 한 시점).

1
  1. 하둡은 다양한 유형의 데이터베이스가 실행되는 생태계입니다. HBase가 당신이 비교하기를 원하는 것이라고 생각합니다. 내가 본 대부분의 벤치 마크에서 Cassandra가 더 느리면이 두 가지를 비교하기위한 벤치 마크를 쉽게 찾을 수 있습니다. 그리고 Hadoop에 대해 이야기 할 때 Cassandra 또는 BigTable보다 훨씬 복잡한 환경이라는 것을 이해해야합니다.
  2. BigTable은 거의 모든 것을 먹을 수 있으며, Google을 지불하면 모두 괜찮을 것입니다. (2 백만 기록/초 기록으로 벤치 마크를 보았습니다).
  3. 카산드라 아키텍처는 DynamoDB (AWS) 및 BigTable 설계를 기반으로합니다. 워크로드가 매우 빠릅니다 (1 초당 100 만 건의 많은 벤치 마크를 찾을 수 있음).
  4. 절대 인터넷에서 벤치마킹을 신뢰하지 마십시오. :) 샘플 데이터로 직접 실행해야합니다. 모든 데이터베이스가 모든 요구에 부합하는 것은 아닙니다. 데이터베이스에 넣으려는 작업 부하에 대한 정보를 조금 더 제공하면 여기 사람들이 필요한 데이터베이스/데이터베이스를 안내 할 수 있습니다. (나열된 3 개 이상이 많이 있습니다.)