2012-07-16 2 views

답변

2

죄송합니다 - 귀하의 질문을 이해할 수 있는지 잘 모르겠습니다.

EMR을 사용하여 왜 전체 DynamoDB 테이블을 스캔하는 대신에 직접 스캔을 수행하는지 묻는다면 대답은 빠르며 간단합니다.

DynamoDB Serde에서 Hive와 같은 것을 사용하는 경우 검색이 병렬화되기 때문에 DynamoDB를 직접 쿼리하는 것보다 훨씬 빠르게 DynamoDB 테이블의 전체 내용을 추출 할 수 있습니다.

DynamoDB는 일관된 읽기 성능을 지원하므로 DynamoDB 테이블을 쿼리 할 때 병목 현상이 발생하여 클라이언트가 데이터를 충분히 빠르게 읽을 수 있습니다.

관련 문제