2012-07-17 2 views
5

아무도 좋은 비교를 제공하기 위해이 두 가지 방법을 사용했습니다. 저는 학교 프로젝트를 진행하고 있으므로 SSIS 비용은 이미 라이센스가 있기 때문에 문제가 아닙니다.SSIS 대 Pentaho

배경에 무슨 일이 벌어지고 있는지. 플랫 파일로 약 10 년간의 특허 정보를 다운로드 할 예정입니다. 결과는 2,080 개의 분리 파일입니다. 한 번에 그들을 MS SQL 서버로로드하는 방법을 원합니다. 그런 다음 DB에 추가 파일을 추가 할 수 있기를 원합니다.

소프트웨어의 속도는 내가 밤새도록 실망시키지 않는 한 많이 신경 쓰지 않습니다. 나는 유연성을 갖춘 무언가를 찾고 있으며, 더욱 중요하게는 사용하기 쉽다. 나는 전에 이런 프로젝트를 해 본 적이 없으며 이사회에서 이것을 어떻게 수행하는지 배우게 될 것입니다.

고맙습니다!

+1

Pentaho에서 작업 한 적이 없지만 SSIS에서이 작업을 시도해보십시오. http://msdn.microsoft.com/en-us/library/dd537533(v=sql.100).aspx –

+0

WOW 1TB에서 30 분만에 충분히 빠릅니다. . 기사 @ WilliamToddSalzman을 주셔서 감사합니다 ... –

답변

5

실제 라이브 프로젝트에서 두 가지를 모두 사용했습니다. 나는 사용하기 쉽고 유연성이있어서 SSIS보다 Pentaho (PDI)를 선호합니다. 사용하기 전에 제목을 조금 읽으십시오. 주전자 (PDI)에 대한 몇 권의 훌륭한 책이 있거나 PDI의 도움말 메뉴에서 시작하기를 읽을 수 있습니다. 이 포럼은 여러분이 붙어 있거나 IRC의 ## pentaho라면 좋은 곳입니다. 환영 화면에서 찾을 수있는 샘플도 많이 도움이됩니다. 나는 그것을 즐기기를 희망한다, 나는 아직도 나는 알고있다. 2006을 사용하고 내가

PS :-) 몇 가지 프로젝트에 SSIS를 사용할 때 항상 화가입니다되었습니다 SQL 서버 DB에 연결하는 jtds 라이브러리의 JDBC 드라이버를 사용, 그것은 당신에게 약간의 두통을 절약 할 수

이 도움이

희망,

바트

+0

답변 주셔서 감사합니다. 플랫 파일로 작업 한 샘플 데이터 세트에서 가장 적은 것을 말하기가 번거로 웠습니다. Excel 또는 Access로 가져올 수 있지만 두 번째는 MS SQL Server를 사용하려고합니다. 기본적으로 마약을 사용한다고합니다. 그래서 데이터를 가져 와서 가져온 다음 .mdb로 저장 한 다음 액세스 권한을 SQL Server로 가져와야합니다. pentaho의 유연성이 향상되면이 문제를 해결할 수 있습니까? –

+0

데이터 덤핑 프로그램이 이미 코딩되어 있고 어느 정도까지 작동하고 있기 때문에 분명한 데이터가 문제가되는 것은 분명하지만 데이터가 덤프 된 후이를 해결할 수있는 방법을 찾을 수 있을지 궁금합니다. 내가 Python을 코딩하는 법을 배워야하는 것은 매우 흥분된다. –

1

PDI 및 SSIS의 ETL 패키지를 개발 며칠 보내고 난 후에 나는 PDI 확실히 더 사용자 친화적이라고 말하는 확신. 사용자 인터페이스는 단독으로 훨씬 더 깨끗하며 매우 직관적이며 사용하기 쉬운 방식으로 흐릅니다.