나는 데이터과 같이 MySQL의에서오고있다 ..효율적인 방법
ItemID
Metric1
Metric2
Metric3
과 같은 데이터가 그래서 하둡을 해내 하이브를 사용 ..
ItemID
Metric1
Metric2
Metric3
이제 ItemID는 고유 한 식별자입니다. 그래서 나는 다음과 같은 열 설정에 하나 개의 파일로 출력 할 거라고 것은 :
ItemID
Metric1 (MySQL)
Metric2 (MySQL)
Metric3 (MySQL)
Metric1 (Hadoop)
Metric2 (Hadoop)
Metric3 (Hadoop)
은 거기에 하나 개의 파일을 통해 반복 한 후 다른 파일에 항목 ID 검색하고 출력 한 후 그것을하는 또 다른 방법은 다른 파일에 일치하는 행을? 이것은 실제로 비효율적 인 것처럼 보입니다.