2013-06-17 2 views
0

하이브에서 db2로 데이터를 복사하는 시나리오가 있습니다. 이것을 구현할 수있는 두 가지 방법이 있습니다. 하나는 sqoop 내보내기 명령을 사용하고 다른 하나는 db2 load 클라이언트입니다. 나는 성능면에서 가장 좋은 방법이 무엇인지 알아야한다. 제게 제안 해주세요.SQOOP 내보내기 명령 VS DB2 LOAD CLIENT

답변

0

Sqoop은 대용량 데이터 파일을 HDFS에서 동시에 (매퍼를 사용하여) db2로 전송하는 데 사용할 수 있습니다. db2 load client에 대해서는 전혀 모른다.

+0

답장을 보내 주신 JtheRocker에게 감사드립니다. – OneTwo

+0

그래, 매퍼가 병렬로 실행되기 때문에 DB2에 업로드하는 속도가 빨라집니다. –

0

종속. DB2 LUW를 사용하는 경우, sqoop 커넥터를 사용하면 사용할 수있는 클러스터 수 (매퍼)에 따라 더 빠를 수 있습니다. DB2로드 (적어도 z 세계에서)는 데이터베이스 시스템의 cp 수에 따라 parrallel로드를 수행 할 수 있습니다. 그래서 그것은 당신의 환경 (데이터베이스 시스템 대 hadoop 클러스터)에 달려 있다고 생각합니다.

관련 문제