저는 고객에게 심층적 인 실시간 분석을 제공 할 수있는 완벽한 스케일 아웃 솔루션을 개발 중입니다.Hadoop 및 분석?
고객은 주로 최대 200 개의 서버를 보유하고 있으며 각각 최대 400 개의 세션이 진행 중이므로 동시에 80000 개의 세션을 제공합니다. 세션에 대한 분석을 제공하고 그래픽 및 쿼리 인터페이스 (기본적으로 쿼리 집계)를 제공하기 위해 Tableau와 같은 BI 도구를 사용할 수 있기를 바랍니다.
각 세션의 길이는 4 분이고 4 분 이내에 약 20 개의 이벤트가 트리거 될 것으로 예상됩니다. 각 이벤트는 약 5 개의 필드, 주로 정수 일 수 있습니다. 시작일, 종료일 및 세션 중 기본적으로 일부 카운터 (예 : 클릭 수)를 기록합니다. 이것은 초당 약 8000 개의 인서트입니다.
RDBMS는 분명히 스케일 아웃하기가 쉽지 않기 때문에 Hadoop에 관한 것이지만 (PostgreSQL이 5000-8000 $ 머신에서이로드를 처리 할 수 있다고 확신한다면 PostgreSQL을 사용할 것입니다).
그러나 Hadoop은 배치 지향적이므로 지연 시간이 너무 길기 때문에 분석에는 적합하지 않을 수 있습니다. 어떻게 생각해 ?
웹 마케팅 업계에서 데이터베이스에 공급하고 쿼리하는 데 사용되는 솔루션은 무엇입니까?
감사합니다.
그래파이트는 모니터링에는 좋지만 분석 항목에는 적합하지 않습니다 (필터/조인 ...). 어쨌든 지적 해 주셔서 고마워요! – SCO