증권 거래 가격과 관련하여 많은 재무 데이터를 분석하기위한 시스템을 구축하고 있습니다. 이에 대한 큰 도전은 데이터가 테라 바이트의 10에 해당 될 경우 데이터에 사용할 저장 방법을 결정하는 것입니다. 평균을 취하거나, 표준 편차를 계산하거나, 가격, 시간, 볼륨 등과 같이 여러 열로 필터링 된 합계와 같은 데이터에 대한 많은 쿼리가있을 것입니다. Join 문은 필수 조건은 아니지만 가지고 있으면 좋을 것입니다.재무 분석 용 데이터 저장소
지금은 평가 목적으로 infobright 커뮤니티 에디션, monetdb 및 greenplum 커뮤니티 에디션을 검토 중입니다. 지금까지는 좋았지 만 고급 기능을 사용하려면 여러 버전 (여러 서버, 삽입/업데이트 문 등 사용)에서 일부 기능을 사용할 수 없습니다.
이 상황에서 어떤 솔루션을 사용 하시겠습니까? 이점을 통해 대안을 제공합니까? 비용 효과가 큰 장점입니다. 필자가 원하는 데이터웨어 하우징 솔루션에 비용을 지불해야한다면 가능하면 오히려이를 피하고 오픈 소스/커뮤니티 에디션을 선택해야합니다.
평균 (합계), 평균, 필터링 된 경우에도 stddevs는 데이터 마이닝이 아닙니다. 그들은 단지 평범한 ** 통계 **입니다. –
데이터 마이닝은 일련의 데이터에서 새로운 정보를 발견하는 것입니다. 통계는이 과정을 돕는 도구입니다. 저는 용어에 대한 강조가 도움이된다고 생각하지 않습니다. 우리가 그것에 대해 논쟁한다면, 어떤 것도 성취하지 못할 것입니다.그것은 당신이 통계를 "통계학"으로 잘못 표기했기 때문에 당신의 게시물에 동의하지 않는다는 것과 같은 말입니다. 그것은 전문성에 대한 불필요한 강조입니다. 내 목표는이 데이터베이스를 사용하여 새로운 정보를 발견하는 것입니다. 또한 데이터웨어 하우징 솔루션은 데이터 마이닝을 염두에두고 개발되었습니다. 따라서 여기서 데이터 마이닝 개념을 적용 할 수 있습니다. – user396404
그러나 나는 "데이터베이스"가이 게시물의 더 좋은 태그 일 것임에 동의합니다. – user396404