2016-09-12 4 views
0

사용자가 응용 프로그램 사용에 관한 정보 (기본적으로 화면 클릭 수, OS 버전, 응용 프로그램 버전 등)가있는 Amazon Redshift에는 3 개의 테이블이 있습니다.적색 변경 데이터 요약

내가 "마지막 로그인"과 같은 세부 사항을 가진 각 사용자의 프로필을 저장하는 것 요약 테이블를 만들려는, 최근에 사용 된 응용 프로그램 버전, 마지막으로 내가 많이 익숙하지 오전

등 화면을 방문 컬럼 데이터베이스로 이전에는 RDBMS에서만 작동했습니다. 지난 하루 동안 세 개의 테이블과 조인 쿼리를 실행하고 결과를 프로필 테이블에 병합하는 cron 작업을 작성하려고했습니다. 이것이 레드 쉬프트에서 가능할 지 모르겠습니다.

답변

1

Amazon Redshift는 완벽하게 호환되는 SQL 데이터베이스입니다. 그것이 컬럼 형 데이터베이스라는 사실은 데이터베이스 사용 방법에 영향을 미치지 않아야합니다. 즉, 특정 유형의 작업 (예 : 테이블에서 수백만, 수십억 개의 행 검색)에서 더 빠르고 효율적일 수 있다는 것을 의미합니다.

정기적 인 데이터베이스 쿼리을 실행하는 것이 좋습니다. 그러나 쿼리를보다 효율적으로 사용하려면 마지막 업데이트 이후 활동이있는 사용자의 정보 만 업데이트해야합니다. 즉, 대부분의 사용자 정보가 매일 바뀌지 않으므로 모든 사용자에 대한 정보를 업데이트하지 마십시오.

쿼리는 기본적으로 "모든 사용자에 대해 최신 클릭, os, 버전 선택"대신 "마지막으로 업데이트 한 이후 시스템에 액세스 한 모든 사용자에 대해 click, os, version의 최신 값 선택" ".

또한 실제로 이러한 테이블이 필요한지 여부를 고려하십시오. 아마도 매일 값을 사전 계산하기보다는 특정 사용자에 대한 정보를 찾고있을 때 즉시이 정보를 검색 할 수 있습니다. 이것은 물론 그러한 정보를 얼마나 자주 검색할지에 달려 있습니다.