현재 Java MapReduce 작업을 수행하고 있습니다.이 작업은 양동이가 된 하이브 테이블에 데이터를 출력해야합니다.Java MapReduce 작업에서 하이브에 쓰기
나는 두 가지 방법을 생각 :
먼저 직접 HCatalog를 통해 하이브 물품. 문제는이 접근 방식이 양동이로 된 하이브 테이블에 쓰는 것을 지원하지 않는다는 것입니다. 따라서 버킷 하이브 테이블을 사용할 때 먼저 버킷이없는 테이블에 작성한 다음 버킷 된 테이블에 복사해야합니다.
두 번째 옵션은 텍스트 파일에 출력을 쓰고 나중에이 데이터를 하이브에로드하는 것입니다.
가장 좋은 방법은 무엇입니까?
방대한 양의 데이터 (메모리 및 소요 시간과 관련하여)에서 어떤 접근 방식이 더 효과적입니까?
양동이가 아닌 하이브 테이블을 사용할 수 있다면 어떤 방법이 더 좋을까요?
고맙습니다.
내가 제대로 이해하는지 확실하지 않습니다. 필요한 경우 버킷 출력을 생성 한 다음 mapreduce 여러 출력 형식을 사용하여 버킷을 만듭니다. 또는 내부적으로 버킷을 만드는 하이브 버킷 테이블에 데이터를 직접로드하십시오. –