2017-11-14 2 views
-2

나는이 두 가지 서비스에 대해 혼란스러워합니다. 그들은 동일한 서비스를 제공하고있는 것으로 보입니다. 아마도 유일한 차이점은 접착제 카탈로그에 다양한 데이터 소스가 포함될 수 있다는 것입니다. AWS Glue가 Redshift를 대체 할 수 있다는 의미입니까?Amazon Redshift와 새로운 AWS Glue 데이터웨어 하우징 서비스의 차이점은 무엇입니까?

+4

AWS Glue는 데이터웨어 하우스가 아닙니다. 접착제는 ETL 서비스입니다. 무엇이라도 Redshift를 Athena와 비교하고 싶지만 접착제는 전혀 비슷한 서비스가 아닙니다. –

+0

답장을 보내 주셔서 감사합니다. 나는 나의 질문을 틀리게 공식화했다고 생각한다. 네, 접착제는 ETL 서비스이지만 Redshift는 데이터웨어 하우스 서비스이지만, Redshift는 ETL 기능이 있어야합니다. 그렇지 않은 경우, 적절한 ETL 작업없이웨어 하우스에 데이터를 저장할 수있는 방법은 무엇입니까? 게다가 스토리지로서의 데이터웨어 하우스는 키가 적고 정규화 제약이없는 데이터베이스 일뿐입니다. 데이터웨어 하우징의 핵심 요소는 첫 번째로 ETL 프로세스와 대용량 저장 공간입니다. – mksoi

+1

Redshift에 ETL 기능이 있고 데이터베이스에 ETL 계층이 있다고 가정합니다. Redshift는 분석 데이터베이스입니다. Redshift로 가져 오기 위해 데이터를 ETL해야하는 경우 Glue와 같은 다른 서비스를 사용합니다. AWS 서비스는 모든 서비스를 제공하기 위해 단일 서비스를 찾는 대신 필요한 솔루션을 만들기 위해 함께 사용하는 빌딩 블록으로 생각할 필요가 있습니다. –

답변

2

의견이 맞습니다.이 두 서비스는 동일하지 않습니다. AWS Redshift는 ETL 서비스이고 AWS Glue는 데이터웨어 하우징 서비스입니다. AWS Documentation에 따르면

:

아마존 Redshift에는 간단하고 비용 효율적인 효율적으로 기존의 비즈니스 인텔리전스 도구를 사용하여 모든 데이터를 분석 할 수 있습니다 빠르고 완벽하게 관리, 페타 바이트 규모의 데이터웨어 하우스 서비스입니다. 정교한 쿼리 최적화, 고성능 로컬 디스크의 기둥 형 스토리지 및 대용량 병렬 쿼리 실행을 사용하여 페타 바이트 단위의 구조화 된 데이터에 대해 복잡한 분석 쿼리를 실행할 수 있습니다.

AWS Documentation에 따르면

AWS 접착제가와 (추출물, 변환 및로드)가 간단하고 비용 효과적 서비스이 데이터를 분류, 청소는, 그것을 풍부하게 완벽하게 관리 ETL입니다 다양한 데이터 저장소간에 안정적으로 이동

AWS에서 제공 한 설명서를 자세히 참조 할 수 있지만 본질적으로 완전히 다른 서비스입니다.

+0

답장을 보내 주셔서 감사합니다. 나는 나의 질문을 틀리게 공식화했다고 생각한다.네, 접착제는 ETL 서비스이지만 Redshift는 데이터웨어 하우스 서비스이지만, Redshift는 ETL 기능이 있어야합니다. 그렇지 않은 경우, 적절한 ETL 작업없이웨어 하우스에 데이터를 저장할 수있는 방법은 무엇입니까? 게다가 스토리지로서의 데이터웨어 하우스는 키가 적고 정규화 제약이없는 데이터베이스 일뿐입니다. 데이터웨어 하우징의 핵심 요소는 첫 번째로 ETL 프로세스와 대용량 저장 공간입니다. – mksoi

+0

저장 부분을 무시하면, 질문 : 내가 레드 쉬프트에서 할 수있는 ETL 작업의 차이점은 무엇입니까? – mksoi

+0

데이터베이스는 어떤 방법으로도 ETL 기능을 제공 할 필요는 없지만 물론 데이터를 가져올 방법이 있어야합니다. 삽입, 업데이트 및 삭제만큼이나 작을 수 있습니다. ETL 도구는 데이터 이동, 조직, 해당 작업의 순서 지정 및 동기화 및 데이터 이동 및 변환 작업 개발을 전문으로하는 도구입니다. – Rich

-1

ETL 작업을 수행하고 Redshift에로드하려면 matillion ETL 도구를 사용하십시오. 이 매트릭스는 S3에서 읽을 수 있습니다. 접착제는 책 카탈로그이며 테이블은 크롤러가 만들고 접착제 카탈로그에 추가됩니다. 이제는 ETL 작업을 수행 할 장소이며 atello를 사용하여 테이블을 쿼리하여 보고서를 작성합니다.

관련 문제