데이터 350Gb (주당 GB 증가)를 처리하는 클러스터 (hadoop, pig)가 있습니다.데이터 분석을위한 NoSql 또는 MySQL
이러한 모든 데이터는 애널리틱스에서 사용할 수 있어야합니다.
스타 스키마가있는 Msyql 솔루션이 있습니다 (데이터 부분 만로드 됨). 그러나
얼마나 스트레칭이 가능한가?
데이터 분석을 위해 Hive와 같은 NoSQL을 사용해야할까요?
나는이 기사를 읽어 http://anders.com/cms/282/Distributed.Data/Hadoop/Hbase/Hive얼마나 큰 빅 데이터이며, 내가 MySQL의에서 멀리보고해야 할 때? Mysql의 구조적 강건성으로 인해 문제가 발생합니까?
현재 데이터는 단지 몇 GB (MySQL의 경우)이지만 확실히 증가 할 것입니다. MySQL 클러스터링은 어떻습니까?
이 경로를 따라야할까요? 이 비교 질문처럼 뭔가에 설명 된 문제의 종류 가지고 시작할 때
mysql에 점점 더 많은 데이터를 보내려고 노력해야 할 문제가 있습니까? – AlgoMan
저장되는 데이터의 양, 사용 방법 및 DB의 기본 설계가 결과 성능에 영향을 미치고 비즈니스 요구 사항에 어떻게 영향을 미치는지는 중요하지 않습니다. 제 생각에 요점은 (a) NoSQL이 결코 MySQL을 대신 할 수는 없다는 것입니다. 그것은 또 다른 옵션 일뿐입니다. 그리고 (b) "올바른 직업을위한 올바른 도구"라고 할 수 있습니다. – jefflunt