단순화를 위해 다음과 같은 배열을 가지고 있습니다. arr[time]=[price,asset]
(가격은 동일한 자산에 대해 초당 12 회까지 반복 될 수 있음).Amazon Redshift Time Series
다른 크기로 데이터를 볼 수 있기를 바랍니다. 1 시간당 1 샘플, 0.5 시간당 1 샘플로 2.5 년, 포인트 간 특정 틱에 액세스 할 수있는 5 년.
DynamoDB에서 다중 테이블을 사용하거나 Redshift에서 단일 데이터베이스를 사용하는 것이 더 경제적/편리합니까? 적색 변이에 어떤 스키마/테이블을 사용합니까?
편집 : 나는 반드시 출력에 큰 범위에 대한 모든 단일 가격 (그래서 클라이언트가 충돌하지 않음)하지 않으 WHERE time>=1504118343 AND time<=1505128343
같은 기간 사이에 검색 할 때 {'time':1505128343,'price':3.141708,'asset':1}
처럼 보이는 실체가 대신 출력 매 n 번째를 싶습니다 가격. 범위가 충분히 큰 우리가 테이블 prices
, prices30s
, prices1h
, prices1day
등의 일련있을 때, 그래서 만약 우리의 prices30s
테이블이 시리즈는 샘플링 것이다 대체되면, 그래서 내 구현에서
나는 다른 스케일에 대해 여러 개의 테이블이있는 것 30 초당 한 번.
죄송합니다. 귀하의 요구 사항이 명확하지 않으므로 귀하의 질문에 답변하기가 어렵습니다. 테이블에 저장된 데이터 샘플과 실행할 샘플 쿼리를 표시 할 수 있습니까? "서로 다른 크기로 데이터보기"와 "점 사이의 특정 진드기에 액세스"란 무엇을 의미합니까? 그리고 '시간 [가격], [자산]'은 무엇을 의미합니까? –
죄송합니다. 자신에 대해 제대로 설명하지 않으면 원래 게시물을 편집하고 정교하게 작성했습니다. – Max0999
데이터를 무작위로 샘플링하는 것이 아니라 평균 (또는 최대) 시간당 가격, 평균 (또는 최대) 연간 가격 등과 같이 주어진 기간 동안 평균 가격을 제공하는 것이 더 좋지 않습니까? Amazon Redshift와 같은 데이터웨어 하우스는 이러한 유형의 계산을 아주 쉽게 처리 할 수 있습니다. –