2012-01-20 2 views
2

여러 소스에서 데이터를 가져 와서 서로 비교하는 분석 프로젝트를 시작할 것입니다. 소스는 Google Analytics API와 같은 API에서 로컬로 호스팅되는 데이터베이스까지 어떤 것이 될 수 있습니다.다른 출처의 데이터를 어떻게 보관해야합니까?

이 데이터를 정기적으로 가져올 단일 데이터베이스를 구축해야합니까?

누구나 모범 사례, 패턴 또는 기사를 제안 할 수 있습니까? 나는 정말로 이것을 어디에서 시작해야할지 모르겠다. 그래서 어떤 정보도 좋을 것이다! 감사!

SQL Server 2008 R2, C# 4.0을 사용합니다.

+0

거대한 질문 : 당신이 제공 한 것과 함께 나는 "그것이 달려있다"보다 더 좋은 대답은 없다고 생각합니다. 이것에 책이 쓰여져 있습니다. "데이터웨어 하우스"에 대한 Amazon 검색 –

+0

좋은 지적은 ... 아마도 최고의 SO 질문이 아닙니다. 나는 다른 기술을 계속 연구 할 것이다. 아마존이나 구글을 검색 할 수 있지만, 비슷한 경험을하고 올바른 방향으로 나를 이끌 수 있기를 바라고 있습니다. – Mike

답변

3

SQL 서버와 함께 제공되는 데이터 통합 ​​기술인 SSIS으로 시작하겠습니다. 필요한 많은 데이터 소스를 처리 할 수 ​​있습니다. Google과 같은 API를 사용하여 데이터를 얻으려면 먼저 스테이징 테이블에 넣어야 할 수도 있습니다.

Analysis Services에 데이터를로드하고 그 작동 방식을 확인하는 기본 소스로 사용할 단일 준비 데이터베이스부터 시작하십시오. SSIS를 사용하여 준비 데이터베이스를 채 웁니다.

+0

발견 : http://www.google.com/ analytics/apps/about? app_id = 1325007을 입력하여 GA 데이터를 가져옵니다. 여태까지는 그런대로 잘됐다. SSIS에 대해 자세히 알아보십시오. – Mike

4

그게 입니다.이라는 질문이 많습니다. 많은 사람들이 데이터웨어 하우징 이외의 일을하고 있습니다.

DWH의 주요 장점 중 하나는 단일 데이터 소스로 여러 데이터 소스를 통합 할 수 있다는 것입니다. 예를 들어 보안 또는 성능상의 이유로이 작업을 원하지 않는 경우가있을 수 있습니다.

마찬가지로 Wikipedia은이 주제에 대한 정보의 첫 번째 정점입니다. 귀하의 질문에 이미 태그가 있기 때문에 StackOverflow가 또 다른 소스 일 수 있습니다.

주제에 정식 책

은 아마 :

  • 는 데이터웨어 하우스 구축 - WH Inmon을
  • 데이터웨어 하우스 툴킷 - 랄프 킴볼, Margy 로스
  • 데이터웨어 하우스 수명주기 툴킷 - 랄프 킴볼 , Margy Ross, Warren Thornthwaite, Joy Mundy, Bob Becker

Inmon 및 Kimball 방식은 근본적으로 다릅니다. Inmon은 최고급 제품에 집중합니다. 기업 DWH 구축에 대한 정규화 된 관계형 접근 방식 인 반면 Kimball의 접근 방식은보다 상향식이며 차원적이고 기능적인 데이터 마트 기반입니다.

DWH Toolkit은 DWH 구축의 기술적 측면에 중점을두고 DWH Lifecycle Toolkit은 기술적 인 세부 사항만큼이나 조직적인 문제를 기반으로합니다.

행운을 빈다.

+1

좋은 답변입니다. SQL Server에 맞게 수정 된 다른 Kimball 책을 추가 할 것입니다. "Microsoft Data Warehouse Toolkit : SQL Server 2008 R2 및 Microsoft Business Intelligence 도구 세트 사용" –

0

다음 단계를 수행해야합니다. 1. 먼저 SSIS, Informatica 또는 기타 ETL 도구와 같은 ETL 플랫폼을 선택해야합니다. 2. 그런 다음 적절한 데이터베이스 오라클이나 SQL 서버와 같이. 3. 이후에 논리적 데이터웨어 하우스 모델링 (Star 또는 Snowflake)과 을 만들어야합니다.마지막으로 전체 데이터웨어 하우스를 개발해야합니다.

두 가지 데이터베이스 즉, 을 작성하는 것이 좋습니다. 1. 다양한 출처의 데이터를 저장하고 세척하기위한 ODS 및 모든 관련 데이터를 저장하기위한웨어 하우스 데이터베이스.

관련 문제