35

우리 회사는 MS BI 스택 (SQL Server Reporting Services, 분석 서비스 및 통합 서비스)에 많은 투자를하고 있지만 오픈 소스에 대해 가장 많이 언급 된 것을 살펴보고 싶습니다 대안 펜타 호는 같습니다.Pentaho 대 Microsoft BI Stack

버전을 설치했는데 그 내용이 매우 어려워졌습니다. 그래서 좋았어. 하지만 실제로 패키지를 철저히 이해하기 위해 실제 작업을 시작할 때가 아닙니다.

펜타 보 대 MS BI의 장단점이나 그러한 비교에 대한 링크는 무엇입니까?

많은 감사를드립니다!

답변

50

Business Objects에서 벗어나는 경로에서 여러 개의 Bi 스택을 검토했습니다. 내 의견이 많이 선호됩니다. 두 도구 세트 모두 우수합니다. 어떤 것들은 내가 평범한 초콜릿보다 초콜릿 퍼지 브라 우니 아이스크림을 선호하는 방법입니다.

펜타 호에는 그들과 함께 일하는 현명한 사람들이 있지만 Microsoft는 잘 투자되고 잘 계획된 길을 걷고 있습니다. MS가 여전히 데이터베이스 시장에서 약자임을 명심하십시오. 오라클은 여기 왕입니다. 경쟁력을 유지하려면 MS는 데이터베이스를 구입할 때 여러 가지 좋은 점을 포기하고 두 번 다시 플랫폼을 재발 명해야합니다. 나는 이것이 데이터베이스에 관한 것이 아니라 DB의 전투로 인해 MS가 스택에 가치를 더할 수있게 해주는 원인이된다는 것을 알고 있습니다.

1) 플랫폼
SQL 서버는 Unix 또는 Linux에서 실행되지 않으므로이 시장에서 자동으로 제외됩니다. Windows는 일부 버전이나 Unix와 거의 같은 가격입니다. Windows는 꽤 싸고 이제는 faily로 실행됩니다. 그것은 리눅스만큼이나 많은 문제를 안겨줍니다.

2.) OLAP
Analysis Services는 2000 버전보다 2005 년 (현재 2008 년) 재발 명되었습니다. 그것은 2000 년에 비해 더 강력했던 광신자의 질서입니다. 펜타 호 (몬드리안)는 일단 커지면 빨리되지 않습니다. 또한 몇 가지 기능이 있습니다. 그것은 꽤 좋지만 도구가 적다. 둘 다 Excel을 플랫폼으로 지원합니다. MS 버전이 더 강력합니다.

3.) ETL
MS-DTS가 SSIS로 대체되었습니다. 다시 말하지만, magnatude의 순서는 속도, 힘 및 능력에서 증가합니다. 모든 데이터 이동 또는 프로그램 제어를 제어합니다. 그것을 할 수 없다면 Powershell에서 스크립트를 작성할 수 있습니다. 2008 년 출시 된 Informatica와 동급입니다. Pentaho - 이전보다 훨씬 좋아졌습니다. 내가 원하는 것만 큼 빠르지는 않지만 내가하고 싶은 모든 일을 할 수 있습니다.

4.) 대시 보드
펜타 호는 이것을 개선했습니다. 그것은 일종의 불편하고 비우 호적이지만 발전 할 수있는 진정한 의미는 없습니다.

5. 보고서
MS 보고서는 정말 강력하지만 사용하기가 어렵지 않습니다. 나는 그것을 더 좋아할 때까지 지금 그것을 좋아하지만 처음에 그것을 싫어했다. 나는 크리스탈 리포트를 사용하고 있었고 MS 리포트 빌더는 훨씬 강력했습니다. 미시시피에서는 어려운 일을하기는 쉽지만 쉬운 일은 조금 더 어렵습니다. Pentaho는 조금 서투른입니다. 나는 그것을 전혀 좋아하지 않았다. 나는 지나치게 복잡하다는 것을 알았다. 나는 그것이 Crystal report builder 나 MS report builder와 같았지만 재 스퍼와 같았 으면 좋겠다. 나는 어려울 것입니다. 그것은 선호 일 수 있습니다.

6.) ad hoc
MS - 이것은 나를위한 진정한 승자였습니다. 필자는 MS 사용자 보고서 작성 도구를 사용하여 즉시 사용자와 테스트했습니다. 차이점은 사용하기 쉽고 생산적이었던 방법이었습니다. Pentaho - 좋지만 꽤 오래된 학교입니다. 그것은 더 전형적인 마법사 기반 모델을 사용하고 강력한 도구를 가지고 있지만 나는 그것을 싫어. 그것은 그것이 무엇인지에 대한 훌륭한 도구이지만, 우리는이 스타일에서 계속 나아 왔고 아무도 돌아가고 싶지 않습니다. logiXML과 동일한 문제가 발생했습니다. 인터페이스는 그 기능이 잘 작동했지만 12 년 동안 사용했던 것에서 큰 변화가 없습니다. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

Pentaho가 실제로 잘 돌아갈 수있는 경험이 많은 사람들이 있습니다. MS 제품군이 생산성이 더 높아진 것으로 나타났습니다.

+0

우수하고 잘 쓰여졌 고, 고마워요! – Tomas

+0

Stradas, 당신은 모든 지역 사회에 훌륭한 정보를 제공하고 있습니다. 글쓰기, 자신의 취향과 콘텐츠 구성으로 인해 정확하지 않을 수있는 것에 대한 경고는 훌륭한 참고 점입니다. 이 시간을내어 주셔서 감사합니다. – vmarquez

+0

NagaMensh, 좀 더 구체적으로 말씀해 주시겠습니까? 학습 곡선은 DTS에 비해 약간 길지만 SSIS는 잘 생각한 도구라고 생각합니다. Informatica가 가장 가까운 비교입니다. 또한 사용하기 쉬운 다른 좋은 도구가 있지만 대부분은 강력하지 않습니다. – Stradas

3

MS BI 스택에는 입력을 제공 할 수 없지만 가장 최근의 Barcamp Orlando에는 Pentaho의 사람들이 거기에있어 그들의 제품에 대해 이야기하고 매우 인상적인 데모였습니다.

정말 좋은 서비스를 위해 유료 패키지뿐만 아니라 자신을 확장 할 수있는 오픈 소스 프로젝트라는 사실 때문에 많은 옵션이 제공됩니다. 그들은 클라이언트를 위해 한 약간의 유급 노동을 보여 주었고, 사람들을 분명히 놀라게했습니다.

펜타 호의 데이터웨어 하우징 측면에서 일하는 개발자와 약간의 대화를 나눌 기회가 있었으며 그는 매우 날카 롭고 제안에 매우 개방적이었으며 어떤 질문에도 답할 수있었습니다.

회사가가는 한, Pentaho는 자신의 작업과 자신의 개발자 모두가 얼마나 친근하고 친근한지에 대해 정말로 인상 깊었습니다.

0

큰 소년에 대한 견고하고 저렴한 대안을 찾고 계시다면 LogiXML은 .NET 플랫폼에서 대시 보드 및 임시보고 기능을 제공합니다. 우리는 펜타 호가 막 시작했을 때 2006 년 말부터 사용 해왔지만, 잠시 보지 않았습니다.

4

필자는 MS Reporting Services를 사용하여 몇 년 전부터 사용하기 시작했습니다. 나는 Penaho의보고 솔루션을 시도하지 않았으므로 이에 대해 언급 할 수 없다. 또한 Analysis Services 나 Pentaho의 대안을 시도하지도 않았습니다.

최근 ETL 솔루션이 필요하고 MSSQL 및 MSRS에 익숙해 져서 MS 통합 서비스를 검토하고 아마 선택하게 될 것 같습니다. 그러나 나를 위해 MSIS는 끔찍했습니다. 주로 직관적이지 않기 때문입니다. 도구를 배우려고 며칠을 보내고 난 후에 대안을 찾기로 결정했고 이전에는 주전자로 알려진 Pentaho Data Integration을 발견했습니다. 나는 그걸 가지고 몇 분 안에 실행하고 즉시 첫 번째 변형을 만들었습니다. 그냥 작동합니다.

필자의 요구 사항은 상당히 간단하지만 성능은 뛰어 났으며 커뮤니티는 매우 유용합니다.

+0

[비즈니스 인텔리전스 전용 Q & A 사이트에 대한 제안이 있습니다. 따라, 게시물 및 지원 그것을 얻을.] (http://area51.stackexchange.com/proposals/70503/business-intelligence?referrer = EPHSm8-3avvaMxLjdRIeNg2) – bonCodigo

8

경고 - SSIS에는 수많은 결함, 버그 및 성가심을 나열하는 수많은 사이트가 있습니다. SSIS가 왜 그 포스트 위에 나왔는지 확신 할 수 없지만, 당신이 프로젝트에 내기하기 전에 사람들이 블로고 스피어에서 무엇을 말하고 있는지보십시오. 내 경험에 비추어 볼 때, 얼마나 끔찍한 SSIS가 작동하는지에 대한 약 20 : 1의 호언 장담 - 나는 현재 대안을 찾고 있으며 동의 할 수 있습니다.

+5

SSIS는 매우 빠르고 (강력한/강력한) 엔진을 가지고 있지만 내 인생에서 함께 일한 가장 귀중한 디자이너 중 한 명입니다. 예를 들어 수많은 사소한 불만이 있습니다. RIGHT() 함수는 있지만 LEFT()는 없습니다! –

+4

SSIS의 문제점은 학습 곡선입니다. 벽돌 벽을 치는 것과 같습니다. 일단 당신이 그것을 배웠다면, 디버깅은 여전히 ​​상당히 어려움에도 불구하고, 더 쉬워진다. 나는 당신이 마스터/아이 패키지 디자인을 가지고 있는지 그리고 각 패키지를 가능한 한 작게 (이유 안에서) 유지할 것을 확신 할 것이다. –

+1

@adolfgarlic : 물론, "왼쪽"이 있습니다. SUBSTRING()이라고 부릅니다. –

0

최근 펜티어 오픈 소스 BI를 사용해 보았습니다. 나는 그것이 매우 서투른 것을 알았다. 그다지 직관적이지 않았고 개발 시간도 오래 걸렸습니다.

오라클 또는 ms BI 솔루션과 완전히 다릅니다. 엔터프라이즈 에디션이 더 좋을 수도 있습니다.

4

SSIS와 Pentaho 주전자를 사용했으며 SSIS 대신 ETL 도구로 Pentaho 주전자를 사용하는 것이 좋습니다.

이유 : - SSIS의 흐름은 작업 할 일입니다. 주전자는 시스템을 통해 흐르는 데이터 행에 대해 생각하게합니다. 주전자의 접근 방식은 나에게 훨씬 직관적 인 것처럼 보입니다. -SSIS의 문서화가 잘 이루어지지 않았습니다. 이것은 일어난다. 그러나 변수를 클릭하고 설정하는 일은 많은 것으로 보입니다. 매우 복잡한. 펜타 호에는 커뮤니티 포럼이있어 도움이됩니다. - 나는 Pentaho가 SQL Server를 포함한 여러 유형의 데이터베이스와 통합되는 것을 신뢰합니다. 또한 좋은 JDBC를 사용할 수 있습니다. 또한 SQL Server와 Oracle 사이를 오가며 한쪽에는 Vertica를, 다른 한쪽에는 Vertica를 사용했습니다. 그것은 Vertica에서 사용할 수있는 벌크 로더를 가지고 있습니다. 그거 참 좋네. - SSIS 패키지를 서버에서 실행하는 것은 매우 어려운 일입니다. 그것은 단지 내 시간의 가치가 없었다. - Pentaho가 사람이나 사람 목록에 경고 또는 오류 메시지를 보내는 것이 매우 쉬운 것으로 나타났습니다. -Pentaho를 사용하면 일부 논리가 필요한 작업을 위해 JavaScript로 작업을 수행 할 수 있습니다. 간단하고 쉽게 우리 대부분이 만났던 언어로 완성되었습니다.

7

여기에 훌륭한 정보가 있습니까? 나는 Pentaho를 시도하지 않고 그것을 조사 할 계획을 가지고 있습니다. 나는 노련한 MS BI 컨설턴트로서 1998 년부터 사용하고 있습니다. SSIS는 매우 빠르며 강력합니다. 그러나 비판은 계속되고 있습니다.

(1) 디버깅하기가 어렵고 문제가 실제로 무엇이고 어디에서 발생했는지에 대한 암시를주지 못할 수도 있습니다.

(2) 이전 의견에 따르면, 이제까지 shittiest 발달 환경입니다! 나는 그들이 무슨 생각을하는지 전혀 모른다.

(a) 100 개 이상의 열로 테이블을 만들고 병합 조인을 넣습니다. 이제 다시 들어가서 병합 조인 (새 열을 가져 오는 것과 같이)에 대한 업데이트를 시도하십시오. 병합 조인에서 확인을 클릭하여 변경 사항을 저장하면 가장 빠른 시스템에서도 몇 분이 걸릴 수 있습니다. 넓은 레코드와 많은 병합 조인이있는 거대한 데이터 흐름이 있습니다. 데이터 흐름에 하나의 열을 추가하는 데는 하루 이상 걸립니다. 병합 조인을 업데이트 한 다음 다른 작업을 수행하고 나중에 5-10 분 후에 완료되었는지 확인해야합니다. 이에 대한 Microsoft의 답변은 패키지를 여러 패키지로 나눠서 데이터를 테이블이나 이진 파일에 저장하는 것입니다. 당신이 모든 단계들 사이에서 디스크로 간다면 SQL에서 모든 것을 잘 할 수 있습니다! ETL 도구의 주요 목적 중 하나는 메모리의 모든 요소에 대한 것이며 디스크 I/O를 피하는 것입니다.

(b)는 디자이너 크게 충돌 때로는 이후의 모든 작업을 잃고 마지막으로 저장 (I 지금 이것 때문에 내 잠에서 CTRL-S을)

나는 해킹을 파악하고 생성했다 (C) 광범위한 레코드를위한 Excel의 SSIS 패키지 XML 나는 600+ 칼럼 기록이 평범한 헬스 케어 클라이언트를 가지고 있습니다. SSIS에서 600 열이있는 파일 형식을 정의하려고하면 모든 단일 열을 한 번에 하나씩 입력해야합니다. MS 액세스조차도 스프레드 시트의 레이아웃을 잘라내어 파일 레이아웃에 붙여 넣을 수 있지만 SSIS는 붙여 넣을 수 없습니다. 그래서 레이아웃에서 XML을 생성하고 XML 코드를 패키지의 적절한 위치에 붙여 넣어야했습니다. 추악한 방법이지만 일과 오류가 많이 발생하지 않았습니다.

(d) (c)와 마찬가지로 모든 열을 다듬어야 할 필요가 있고 600 개 이상 있다고 가정하면 어떻게 될까요? 파생 된 열 구성 요소에서 trim (column1)을 600 번 이상 입력해야합니다! 이제 Excel 시트에서 쉽게 생성 할 수 있으므로 데이터를 가져 오기 위해 SQL 쿼리에서 이와 같은 간단한 변환을 모두 수행합니다.

(e) 많은 기발한 것들이 있습니다. 보이지 않는 구성 요소가 있고, 때로는 패키지를 열고 모든 구성 요소가 비 일관 적으로 완전히 다시 정렬됩니다.

(f) FTP 기능 (ETL에서 필요한 가장 일반적인 기능 중 하나 일 수 있음)은 약하고 오직 아무도 사용하지 않는 일반 바닐라 FTP 만 지원합니다. 모두 요즘은 SFTP, FTPS, https 등을 사용합니다. 거의 모든 구현에서 패키지가 호출해야하는 타사 추천 파일 전송 앱을 사용해야합니다.

(g) Windows Vista의 어리석은 보안과 마찬가지로 CYA를 시도하면서 Microsoft는 실제로 SSIS 패키지를 한 환경에서 다른 환경으로 승격시키는 것을 매우 어렵게 만들었습니다. 기본적으로 "사용자 키로 중요한 정보 암호화"라는 바보 같은 짓을합니다. 이는 사용자가 개발 한 환경에서 동일한 계정으로 실행해야한다는 것을 의미합니다. 구성하는 것이 더 좋은 방법이지만 항상 완전히 쓸모없는 보안 보호로 되돌려 놓으려고합니다.

(h) 마지막으로 이러한 문제의 대부분은 현재 Microsoft에 제 3의 버전이며, Microsoft는이를 수정할 계획이 없음을 분명히 나타냅니다.

(i) 디버깅은 다른 언어보다 쉽지 않습니다.

SSIS에는 여전히 많은 이점이 있지만 심각한 고통이 없습니다. 창에서 설정이 부담 모든 펜타 도구의 윈도우 버전이 있지만

+0

이것은 귀중한 정보입니다. 감사합니다. –

+0

위의 SSIS에 관해 제기 된 많은 점에 동의합니다. 나는 MS가 2005 년에 DTS를 대체 ​​할 완전히 새로운 제품을 만드는 데 많은 노력을 기울인 이유에 대해 신비 스럽다. 나에게 좌절감을주는 많은 것들 중 하나는 다른 MS 제품에 대한 커넥터가 없다는 것입니다. 예를 들어 요즘은 데이터 소스가 매우 일반적 임에도 불구하고 SharePoint 데이터 소스 커넥터가 내장되어 있지 않습니다 (더 이상한 MS가 지원되지 않는 SharePoint 연결을 코드 샘플이지만 핵심 제품에 포함시키려는 노력을 결코 투자하지 않았습니다.) – Nathan

3

점 몇

  • 를 추가 할 수 있습니다. Pentaho (특히 GUI 도구와 별개의 서버 시작 및 중지)는 일반적으로 Windows 숍이 아닌 Linux에서 사용되며 Windows에서 Linux 로의 학습 곡선이 가파르게 진행됩니다.
  • 아무 도구 나 이동하면 학습 곡선이 생깁니다. 문제가있을 때 항상 확인을 클릭하고 메타 데이터를 새로 고치는 데 익숙해지면 SSIS가 그렇게 나쁘지 않습니다. Pentaho는 너무 편찮을 수 있습니다.

더 큰 문화적 질문 - 어떤 종류의 상점에서 오픈 소스 도구를 사용합니까? 필자의 경험에 비추어 볼 때, Microsoft 상점에서 연결 문자열과 관련하여 어려움을 겪었을 때, 도움을 얻을 수있는 Microsoft 상점이 많다는 사실을 알게되었습니다. Pentaho 및 Linux 상점에서는 더 많은 DYI 상점이 있습니다.

BTW, 데모를하고있는 판매원 인 Pentaho를 조심하십시오. 그들이 보여주는 모든 것들이 보이는 것보다 훨씬 열심히 일합니다! :)