2013-06-17 4 views
0

우리 회사가 mongo를 사용하기 시작했으며 mongodb에서 데이터를 추출하고 데이터웨어 하우스로 보내는 가장 좋은 방법은 무엇인지 생각하기 시작했습니다.데이터웨어 하우스 사용을 위해 mongo 컬렉션에서 데이터를 추출하는 방법

제 질문은 프로세스의 추출 부분에 중점을 둡니다. 내가보기에 가장 좋은 방법은 mongo 위에 구축 된 서비스에 API를 노출하여 ETL 프로세스 (데이터웨어 하우스의 작업에 의해 호출 됨)가 쿼리 할 특정 쿼리와 함께 실행된다는 것입니다 시간의 집합 (즉, 모든 레코드의 시작일과 종료일).

소리가 맞지 않거나 뭔가 빠졌거나 그보다 나은 방법이 있습니까?

처음에는 모든 X 기간을 mongoexport 할 생각 이었지만 문서에 따르면 성능이 현저하지는 않습니다.

미리 감사드립니다.

답변

0
+0

안녕하세요, 제 질문에 대한 답변이 없기 때문에이게 도움이되지 않습니다. – Alon1980

+0

제 조언은 etl 도구로 db 엔진을 사용하지 않는 것입니다. 주전자를 사용하고 일렬 서버 또는 cron을 통해 일정을 계획하십시오. 케틀 4.4를 열고 변환 단계 Big Data/MongoDb Input and Output을 사용하십시오. – jipipayo

+0

아직도, 당신의 제안을 이해한다면 - 일정 엔진이 몽고어 쿼리를 올리겠습니까? – Alon1980

0

나는 전용 커넥터와 MongoDB를에서 추출 사이에서 선택적 데이터 준비와 함께, 극적 장면에로드 내 데이터 수험하는 Alteryx 디자이너를 사용하고 있습니다. 꽤 잘 작동합니다! ALteryx는 대부분의 DB에 글을 쓸 수 있습니다 ...

관련 문제