2014-02-27 3 views
0

설명서 별,AMPLab Shark on Apache Spark

"Apache Spark는 대규모 데이터 처리를위한 빠르고 일반적인 엔진입니다."

"Shark는 Hadoop 데이터를위한 오픈 소스 분산 SQL 쿼리 엔진입니다."

그리고 상어는 스파크를 의존성으로 사용합니다.

내 질문은 Spark이 HiveQL을 Spark 작업으로 구문 분석하는지 아니면 분석 쿼리에 대한 빠른 응답을 위해 Shark를 사용하면 좋을까요?

+0

그래서 ..... 무엇이 당신의 질문입니까? 그것은 명확하게 진술되지 않았습니다. –

+0

게시물 업데이트 –

답변

3

예, Shark는 Hive와 동일한 아이디어를 사용하지만 MapReduce 작업 대신 HiveQL을 Spark 작업으로 변환합니다. 이 두 가지 아키텍처 차이점에 대해서는 this 문서의 13-14 페이지를 읽어보십시오.