질문이 있습니다. Mapreduce Job을 사용하여 HiveQL 문을 구현하는 방법. 예를 들어 color, width 및 다른 컬럼들과 같은 컬럼 이름을 가진 테이블이있다. 하이브에서 색상을 선택하려면 tablename;에서 선택 색상을 지정할 수 있다고 가정합니다. 같은 방식으로 Mapreduce에서 색상을 가져 오는 코드는 무엇입니까?Mapreduce HiveQL 문을 구현하는 작업
0
A
답변
0
Thrift 서버를 사용할 수 있습니다. JDBC를 통해 하이브에 연결할 수 있습니다. 클래스 패스에 hive-jdbc jar를 포함하면됩니다.
그러나이 방법을 사용 하시겠습니까? 글쎄, 나는 정말로 확신하지 못한다. 이것은 매퍼 (mapper)에서 no로 수행하는 경우 매우 나쁜 디자인 패턴입니다. 매퍼의 수는 데이터 크기에 따라 결정됩니다.
MR 작업으로의 다중 입력으로 동일한 작업을 수행 할 수 있습니다.
그러나 그렇다면 유스 케이스에 대해 많이 알지 못합니다. 그래서 절약은가는 길일 것입니다. 맵리 듀스 작업에 하이브 쿼리를 변환
0
는 ysmart는 최선의 선택을하다
http://ysmart.cse.ohio-state.edu/
어느 ysmart 다운로드 할 수 있습니다 또는 온라인 버전을 사용할 수 있습니다.
+0
감사합니다 sachinjose :) – user3456850
0
MapReduce Design Patterns
책에서 companion codeChapter 5 - Join Patterns
을 확인하십시오. 조인 패턴에서 필드는 매퍼에서 추출되어 방출됩니다.
관련 문제
- 1. HiveQL 트윗
- 2. 숫자 합산을위한 MapReduce 작업
- 3. HiveQL :
- 4. mapreduce - 작업 ID가
- 5. Mapreduce - 시퀀스 작업?
- 6. 매퍼가없는 MapReduce 작업
- 7. Oozie에서 MapReduce 작업 실행
- 8. HiveQL - 문자열에 hiveql UDF가 포함되어 있습니까?
- 9. 별칭 HiveQL
- 10. Mapreduce : 모든 작업 통계를 캡처하십시오.
- 11. HBase MapReduce, 다중 테이블 작업
- 12. Amazon MapReduce 감속사 작업 없음
- 13. MapReduce 작업 입력으로 S3 사용
- 14. 웹 페이지로 링크 MapReduce 작업
- 15. MapReduce 감속기 간의 작업 분포
- 16. hadoop에서 여러 MapReduce 작업 실행
- 17. Disch (MapReduce)의 체인 작업
- 18. MapReduce 작업 실행시 일련의 이벤트
- 19. python mapreduce 작업 반환 오류
- 20. SQL에서 HiveQL 생성기
- 21. HiveQL UNION ALL
- 22. HiveQL Inequality Join
- 23. HiveQL 및 rank()
- 24. HiveQL 타임 스탬프 오류
- 25. C# yield 문을 구현하는 알고리즘
- 26. Solaris에서 Solaris 문을 구현하는 경우
- 27. Hadoop : 연속적인 mapreduce 작업 사이에서 데이터 전달
- 28. Hadoop MapReduce 작업 사용 권한이 거부되었습니다.
- 29. Mapreduce 작업 - 완료하는 데 너무 오래 걸림
- 30. hadoop mapreduce - 작업 로그를 얻기위한 API
감사합니다. Venkat. 나는 그것을 시도 할 것이다. – user3456850