2011-04-07 6 views
0

나는 키가 fieldtimestamp의 조합으로 많은 분야 & 타임 스탬프에 대한 배열 등의 데이터를 저장하기위한 확장 NoSql 솔루션이 필요합니다. > "FIELD_NAME.YYYYMMDD.HHMMSS"배열을 저장하는 NoSQL 솔루션?

VALUE - -> [V1, V2, V3, V4, V5

KEY :

데이터는 다음과 같은 방식으로 저장됩니다 , V6 (v1..v6 그냥 floats이다) 예를 들어

, 가정이 :

FIELD_NAME = "TO MATO "

TIME_STAMP ="20060316.184356는 "

= [72.34, -22.83, -0.938, 0.265, -2047.23]

내가 VALUE를 검색 할 수 있어야합니다

(전체 배열) FIELD_NAME & TIME_STAMP의 조합이 주어집니다.

쿼리 VALUES [ "TOMATO.20060316.184356은"] 벡터를 반환 [72.34, -22.83, -0.938, 0.265, -2047.23]. 배열 읽기는 가능한 한 빨리해야합니다.

그러나 배열 내에 스칼라 값을 (적절한 위치에) 저장하는 방법이 필요합니다. 타임 스탬프 의 첫 번째 요소를 2006/03/16.18:43:56의 타임 스탬프 500.867에 할당하려고한다고 가정합니다. 이러한 경우에, 나는 그렇게 빠른 메커니즘이 필요합니다 - 같은 :

값을 [ "TOMATO.20060316.184356"] [0] = 500.867 (이 디스크에 업데이트 것)

NoSql 솔루션이 가장 적합 할 것이라는 아이디어가 있습니다 (python 인터페이스 인 경우 큰 플러스). 나는 빠르고 강력한 해결책을 찾고있다. 내 데이터 요구량은 약 20 [TB]까지 증가 할 것입니다.

+2

가능한 20 [TB \] 데이터를 벡터/배열로 저장할 수있는 NoSql 솔루션?] (http://stackoverflow.com/questions/5560394/nosql-solution-to-store-20tb-of) -data-as-vector-array) –

답변

0

귀하의 데이터는 고도로 구조화되고 규칙적입니다. NoSQL과 전통적인 데이터베이스의 차이점은 무엇입니까?

MySQL 클러스터 (http://dev.mysql.com/downloads/cluster/)가 문제에 맞게 맞춤 설정되어 있다고 생각합니다.

편집 :

user540009 @ : 내가 거기 단일 시스템에 심각한 성능 저하 또는 반 테라 바이트보다 큰 MySQL을 미러 인스턴스가 있으며, 아무도 수동 샤딩 처리해야 싶어 동의 MySQL Cluster는이를 처리하기위한 것이고, 최대 110 테라 바이트의 구현을 읽었습니다.

+0

이러한 크기 (수십 TB)가 생길 때 MySQL에 심각한 스케일링 문제가 있습니다. NoSql을 사용하면 수평으로 확장 할 수 있습니다. – user3262424

3

MongoDB와 같은 사운드가 적합 할 것입니다. PyMongo은 API입니다.

+0

감사합니다. '카산드라 '보다 더 적합하다고 생각하십니까? – user3262424

+0

@ user540009 나는 그렇다. 하지만 편견이 있어요. :) – Alex

+0

그 이유는 무엇입니까 (바이어스 ...)? – user3262424

관련 문제