나는 Cassandra와 Spark를 함께 사용하는 것이 상대적으로 인기가 있음을 알았다.Cassandra와 함께 Spark을 사용할 때의 이점
나는 Cassandra가 일관성보다 신뢰성을 제공하는 BigData 솔루션이므로 실시간 시스템에 적합하다는 것을 알고 있습니다. 또한 쿼리에 대해 SQL과 유사한 구문을 제공하지만 일반 데이터베이스와는 다른 방식으로 데이터를 관리합니다.
반면에 Hadoop은 안정성에 대한 일관성을 제공하므로 분석 시스템에 적합합니다. 그것의 인터페이스는 MapReduce 다. 요즘은 상당히 느리고 너무 낮다. Sparks는 Hadoop의 HDFS를 사용하고 이전 MapReduce를 하드 디스크보다는 메모리를 더 많이 사용하는 더 나은 아키텍처로 대체하고 RDD 및 데이터 프레임과 같은 더 우수한 인터페이스를 제공합니다.
제 질문은 : 왜 Cassandra와 결합 된 Spark를 사용하고 싶습니까? 그 이점은 무엇입니까? 왜 그 중 하나만 사용하지 않으시겠습니까?
내가 아는 한 Cassandra는 단지 HDFS를 대체 할 것이므로 일관성에 대한 신뢰성이 있어야하며 CQL 대신 RDD/dataframes를 사용해야하며 스파크는 CQL을 생성합니다. 나에게 통제력이 떨어진다.