2011-01-27 3 views
3

수십억 개의 레코드가 포함 된 학술 프로젝트의 아키텍처 단계에 있습니다. 이 프로젝트는 컴퓨팅 성능면에서 매우 가볍고 확장 성이 뛰어납니다. 정보 구조는 매우 간단합니다. 각각 다른 기능을 가진 항목 목록을 저장해야합니다. 이 기능은 정수, 소수, 날짜, 문자열 등입니다. 데이터를 가져올 때 기능의 유형을 알 수 있습니다. 또한 기능을 사용하여 다른 항목을 참조 할 수도 있습니다.
필자는 해당 기능 (둘 이상)을 사용하여 항목 목록을 가져오고 정렬 할 수 있어야합니다 (예 :>, <, = 및 정규식, 길이, 왼쪽, 오른쪽, 중순) 값과 사용자 임의 입력에 대해NoSQL DB 및보고

합계, 평균, 그룹화에 대한보고는 더욱 완화 된 요구에 의해 필요합니다. 전체 큐브 기능이 필요하지 않지만 더 많은 것이 좋습니다.

저는 NoSQL 세계 전체에서 매우 새롭습니다. 무엇을 추천하나요?.

답변

4

MongoDB에 대한 자습서를 살펴 본다면 내 의견으로는 쿼리 및 집계에 사용되는 Map/Reduce 시스템에 대한 최고의 소개가 있습니다.

NoSQL이 갈 경로라는 것을 왜 미리 결론 내 었는지 궁금합니다. 다른 항목에는 스키마가 다를 수 있지만 고정 된 수의 엔터티 및 특성이 있고 SQL을 배제한 이유는 데이터를 저장하고 쿼리하는 데 수십 년 동안 누적 된 기능을 보유하고 있기 때문입니다.

+0

속성은 완전히 임의적입니다. 나는 SQL VLDB에 대한 경험이 있으며 좋지 않다. 너무 많은 취급이 필요합니다. – Sonia

+0

NoSQL을 "완전히 임의"로 가리키며 이해합니다. 이것은 내가 말했듯이 Map/Reduce를 배우려는 것입니다. 나는 그것을 스스로 배웠다. 그리고 궁극적으로 MongoDB에 가지 않을지도 모르지만, 나는 그것의 튜토리얼을 최상으로 찾는다. 그래서 배우는 것이 가장 좋은 것처럼 보인다. –

+0

현재 NoSQL DB에 대해 복잡한 쿼리를 수행하는 방법이 Map/Reduce를 사용하고 있다고 알고 있습니다. – Sonia

0

집계를 사용하려는 경우 map reduce를 사용하여 집계 테이블을 채운 다음 해당 데이터를 제공 할 수 있습니다.

쿼리를 작성할 때마다 맵을 줄이는 것은 번거롭고 Apache Pig와 Hive도 살펴볼 수 있습니다. 이것은 당신이 말하고있는 특별한 질문에 친절하게 도움이됩니다.