mongodb 서버에 백만 개의 블로그 & 뉴스 기사를 저장한다고 가정 해 봅시다.실시간 집계 및 저장을위한 몽고 (Mongodb) 디자인?
이러한 기사에는 범주, 작성자, 위치, 도메인 등 집계에 사용할 수있는 몇 가지 필드가 있습니다. 이러한 기사를 몽고 데이터베이스에 저장할 수 있지만 그 기사에는 텍스트, 요약 등의 필드가 있습니다. 꽤 많은 양의 데이터를 포함하고 아마도 상당히 큰 문서를 만들 수 있습니다 (여전히 < 16MB).
제 질문은 mongodb가 집계를 실행할 때 전체 문서를 메모리로 읽어서 집계를 수행합니까? 분명히 디스크의 모든 데이터는 메모리에 맞지 않습니다. 문서의 크기가 집계 성능에 영향을 줍니까?
저장을위한 좋은 디자인/대안 & "REALTIME"집계 란 무엇입니까?
Realtime aggregation이 필수이므로 Hadoop과 같은 배치 프로세스를 내 프로젝트에 사용하고 싶지 않습니다. 2 mongo dbs의 설정을 보았습니다. 원본 문서를 저장하는 저장 공간 1 개, 별표 스키마에 집계 필드를 저장하는 저장 공간 1 개가 있었지만 두 가지 버전을 유지해야하므로이 방법이 맘에 들지 않습니다. 2 곳의 문서.
감사합니다.
이렇게하면 물어볼 주제가 조금 [ "너무 넓습니다"(http://stackoverflow.com/help/dont-ask)). 특정 항목으로 범위를 좁히거나이를 질문의 한 부분으로 분해하십시오. –