2014-02-26 3 views
0

블로그에서 내 이해에 따르면, 원사 (mapred2)는 hadoop의 mapreduce보다 빠르고 똑똑합니다. 그것이 사실이라면 성능을 향상 시키거나 자원의 사용을 증가시키기 위해 어떤 문제없이 Yarn/Mapred2를 사용하도록 Hive를 구성하는 방법이 있습니까?아파치 하이브 사

+0

hadoop2/Yarn을 지원하는 Hive 버전을 설치해야합니다. 우리는 hadoop-2.2.0 클러스터에서 Hive 0.12를 실행하고 있으며 일화 일 뿐이지 만 테스트를 실행하지는 않았지만 현저한 성능 개선이있었습니다. – Vishal

답변

1

하이브는 얀의 마더 보드에서 실행됩니다.

그러나 원사에서 오래된 하이브를 실행하는 것은 지구를 산산조각 낼 수있는 경험이되지 않습니다. 아마도 같은 시간을 측정하게 될 것입니다. 원하는 것은 최신 Hive 개발 및 개선 (예 : ORC and Vectorization)을 얻고 아마도 Hive on Tez을 실행 해 보는 것입니다. Stinger에 대한 정보를 읽으면서이 내용을 deployment guide에 전달하는 것이 좋습니다.

+0

테스트 환경에서 Hadoop 1에서 Hadoop 2로 이동하면 20 % ~ 30 % 향상되었습니다. Remus가 언급 한 개선 사항은 훨씬 더 충실합니다. –