최근에 저자가 Hbase와 Hive를 통합하는 것에 관해 언급 한 블로그를 보았습니다. 이것이 가능한지, 그렇다면 성능과 확장 성 측면에서 둘 다 사용할 때의 장점은 무엇입니까? 내가 잘못하면 친절하게 정정하십시오.Hbase와 Hive를 통합 할 때의 이점은 무엇입니까
답변
나는 그것이 가능할 것이라고 생각하지만 조금은 셋업하기가 쉽지 않을 것이다. 아마도 CDH3 파이널에는 출간 될 때 통합이 포함될 것이다.
장점 : hbase를 통한 하이브 쿼리. 조인과 HBase 데이터에 대한 집계 및 간단한 조작을 수행하는 쉬운 방법을 생각하십시오.
하이브를 사용하고 HBase를 사용하지 않는 이유는 무엇입니까? HBase는 데이터를 온라인으로 유지할 수있는 확장 가능한 스토리지 인프라를 제공합니다. StumbleUpon은 라이브 웹 사이트에 HBase를 사용합니다. 하이브는 실시간 쿼리 엔진이 아니기 때문에 데이터 저장소를 비슷한 목적으로 사용할 수 없습니다. HBase 이상의 하이브는 두 세계의 이익을 제공합니다.
현재 HBase와 Hive간에 데이터를로드 할 수있는 패치가 있습니다. 당신은 여기에서 찾을 수 있습니다
http://wiki.apache.org/hadoop/Hive/HBaseIntegration
구현 오버 헤드가 매우 높은 것으로 보인다.
HBase 테이블에서 검사를 실행하고 외부 파일에 저장 한 다음 데이터 조작을 위해 Hive로 가져 오는 것이 더 쉽습니다. (이것은 또한 꽤 귀찮은 일이지만, 만약 당신이 그것을 정기적으로하고 있다면 스크립팅 될 수 있습니다.) 이것은 현재 제가 현재 작업하고있는 해결책입니다. 어떻게 진행되는지 알려 드리겠습니다.
HBase over Hive를 선택하는 이유는 실제로 상호 교환 할 수 없습니다. HBase는 Hadoop 위에 구축 된 확장 성이 뛰어난 데이터 저장소로서 데이터 분석을 거의 지원하지 않습니다. Hive는 프로덕션 환경에서 데이터를 저장하는 데 사용되지 않고 대용량 데이터에 대해 특정 쿼리를 실행하는 것을 매우 쉽게 만듭니다.
- 1. php와 html을 분리 할 때의 이점은 무엇입니까?
- 2. SharePoint에서 InfoPath 양식을 사용할 때의 이점은 무엇입니까?
- 3. 오픈 소스 프로젝트에 기여할 때의 이점은 무엇입니까?
- 4. postgresql에서 plpgsql을 사용할 때의 이점은 무엇입니까
- 5. OGNL에서 Spring EL을 사용할 때의 이점은 무엇입니까?
- 6. 파이썬 라이브러리/애플리케이션을 .egg 파일로 패키징 할 때의 이점은 무엇입니까?
- 7. 함수를 "인라인"으로 선언 할 때의 이점은 무엇입니까?
- 8. 스크립팅 언어로 DLR로 전환 할 때의 주요 이점은 무엇입니까?
- 9. 문자열을 자바 스크립트 배열의 initiliase로 분할 할 때의 이점은 무엇입니까?
- 10. GridView를 Page_PreRender와 Page_Load에서 바인딩 할 때의 이점은 무엇입니까?
- 11. android와 facebook을 통합 할 때의 문제
- 12. ASP.NET : 사이트 맵 기반 탐색을 사용할 때의 이점은 무엇입니까?
- 13. AS3의 EventListeners에서 약한 참조를 사용했을 때의 이점은 무엇입니까?
- 14. Memcached에서 레코드를 업데이트하는 것보다 레코드를 삭제할 때의 이점은 무엇입니까?
- 15. C++ 유형 캐스트 : 명시 적 캐스트를 사용할 때의 이점은 무엇입니까?
- 16. text/plain보다 application/json을 사용할 때의 이점은 무엇입니까?
- 17. Hypervisor VM의 이점은 무엇입니까?
- 18. 세션에 직렬화 된 객체를 전달할 때와 직렬화되지 않은 객체를 직렬화 할 때의 이점은 무엇입니까?
- 19. WCF를 사용하여 Sharepoint Services WSS3.0과 함께 작업 할 때의 이점은 무엇입니까?
- 20. currying의 실질적인 이점은 무엇입니까?
- 21. JCA의 이점은 무엇입니까?
- 22. CommonJS에서 '약속'추상화의 이점은 무엇입니까?
- 23. WCF에서 WSDualHttpBinding의 이점은 무엇입니까?
- 24. Linux에서 Java를 실행하면 얻을 수있는 이점은 무엇입니까?
- 25. 매크로 : 이점은 무엇입니까?
- 26. "계단"분기의 이점은 무엇입니까?
- 27. 동적 타이핑의 이점은 무엇입니까?
- 28. xCode 4.0을 사용하여 iPhone 시뮬레이터에서 GDATA를 통합 할 때의 문제
- 29. Visual C++ GUI 기존 C++ 코드를 통합 할 때의 문제
- 30. 내 응용 프로그램에서 Facebook을 통합 할 때의 문제