2012-09-13 2 views
3

Hadoop Distributed File System (HDFS)에서 정기적으로 관계형 DB (PostgreSQL)로 데이터를 가져 오려면 프로세스가 필요합니다. 시간당 수백만 개의 레코드를 전송해야하며 HDFS에서 데이터를 이동시키는 데 가장 적합한 업계 표준을 찾고 있습니다. 어떤 제안이 있습니까? 아이디어는 웹 애플리케이션이 PostgreSQL과 상호 작용하여 데이터를 집계하는 것입니다.HDFS to PostgreSQL

답변

3

Sqoop은 관계형 데이터 저장소와 Hadoop간에 데이터를 이동하기 위해 만들어졌습니다. 특히 sqoop-export을 원합니다.

+0

답장을 보내 주셔서 감사합니다. Donald! 그러나 sqoop이 PostgreSQL 로의 데이터 내보내기를 지원하지 않는다고 생각했습니다. – user1666942