DataSax Academy에서 Cassandra 비디오 중 하나를 시청하고있었습니다. 그들이 많이 이야기하는 개념 중 하나는 쿼리 기반 모델링입니다. 이는 KillrVideo 예제에서와 같이 쿼리를 선행 적으로 파악한 경우에 유용합니다.쿼리 기반 모델링 및 빅 데이터
그러나 대용량 데이터의 경우 분석가가 5 개월 또는 1 년 동안 데이터를 어떤 유형의 쿼리를 수행하는지 거의 알지 못한다고 생각하는 유일한 사람이 아니기를 바랍니다.
이 경우 데이터를 저장하는 가장 좋은 방법은 무엇입니까? 내 생각 엔 그런 데이터에 대해 고급 질의를하면 Spark에 데이터를로드하게 될 것입니다. 그러나 검색시 운영상의 문제 및 문제를 피하기 위해 보관시 고려해야 할 사항은 무엇입니까? 어떤 접근 방법이 덜 문제가 되는가?