2017-02-11 2 views
2

s3 디렉토리에있는 CSV 파일의 기본 SQL 쿼리를 사용하려고합니다. Presto는 자연스러운 느낌이었습니다 (파일 크기는 10GB 임). Presto에서 설정을 진행하면서 하이브 (Hive) 커넥터를 사용하여 테이블을 만들려고했습니다. Presto에서 내 테이블 구성을 저장하기 위해 하이브 메타 스토어 만 필요했는지, 아니면 먼저 거기에 만들어야하는지 분명하지 않았습니다.Presto and Hive

설명서를 사용하면 하이브를 구성 할 필요없이 프레스토를 사용할 수 있지만 하이브 구문을 사용할 수 있습니다. 정확하니? 내 경험으로 AWS S3는 연결할 수 없었습니다.

+0

사이드 노트 : Presto의 서버리스 구현 인 [Amazon Athena] (http://docs.aws.amazon.com/athena/latest/ug/what-is.html) 사용을 고려해 볼 수도 있습니다. 그러나 현재로서는 몇 군데에만 있습니다. –

+0

Amazon Athena를 사용하고 싶지만 특정 사용 사례 (의료)에 적합하지 않습니다. –

+0

AWS S3가 연결할 수 없다는 경험이 있습니다 ._ 문제는 정확히 무엇입니까? Presto Hive 커넥터는 IAM 역할을 사용하여 EC2 시스템에 S3에 대한 액세스 권한을 부여하는 경우 상자에서 S3 (적어도's3a : //')를 지원합니다. –

답변

0

Presto 구문은 Hive 구문과 유사합니다. 대부분의 간단한 쿼리의 경우 동일한 구문이 두 가지 모두에서 작동합니다. 그러나 Presto와 Hive가 전혀 다른 점이 없습니다. 예를 들어 Hive에서는 LATERAL VIEW EXPLODE을 사용하는 반면 Presto에서는 CROSS JOIN UNNEST을 사용합니다. 이 둘 사이에는 미묘한 차이가있는 많은 예제가 있습니다.