Amazon의 Dynamo-DB에 대해 EMR 또는 Scan을 사용하는 경우?

EMR과 Scan 모두 전체 테이블을 구문 분석하고 요청 크레딧을 사용하지만 EMR은 ec2 인스턴스를 사용해야하므로 훨씬 더 많은 비용이 소요됩니다.Amazon의 Dynamo-DB에 대해 EMR 또는 Scan을 사용하는 경우?

그렇다면 아마존의 Dynamo-DB에서 스캔하는 것보다 EMR이 더 적합할까요?

2012-07-16 yadutaf

죄송합니다 - 귀하의 질문을 이해할 수 있는지 잘 모르겠습니다.

EMR을 사용하여 왜 전체 DynamoDB 테이블을 스캔하는 대신에 직접 스캔을 수행하는지 묻는다면 대답은 빠르며 간단합니다.

DynamoDB Serde에서 Hive와 같은 것을 사용하는 경우 검색이 병렬화되기 때문에 DynamoDB를 직접 쿼리하는 것보다 훨씬 빠르게 DynamoDB 테이블의 전체 내용을 추출 할 수 있습니다.

DynamoDB는 일관된 읽기 성능을 지원하므로 DynamoDB 테이블을 쿼리 할 때 병목 현상이 발생하여 클라이언트가 데이터를 충분히 빠르게 읽을 수 있습니다.

2012-07-16 21:36:29 seedhead

답변