2012-01-21 2 views
3

전자 상거래 웹 사이트 용 웹 분석 도구 개발을 시작하려고합니다.웹 분석 도구 구축을위한 조언 (선호하는 Python이 적합) - OLAP/Python

기본적으로 페이지 및 페이지 뷰의 다양한 요소를 클릭하면 몇 가지 이벤트가 기록됩니다.

이 이벤트는 메타 데이터 (로그인 한 사용자의 이름, 국가, 나이 등)를 전달하며 페이지 자체는 다른 메타 데이터 (범주, 하위 범주, 제품 등 ...)를 전달합니다.

얼마나 많은 고객 국가에서 방문 x를 카테고리 Y :

내 회사는 OLAP 큐브 같은, 같은 질문에 대답 할 수 있기를 원하십니까? 2012 년 1 월 카테고리 x에 대한 페이지 뷰 수는? 국가 x의 고객이 카테고리 y를 얼마나 많이 방문 했습니까?

필자는 OLAP 엔진을 사용하여 이러한 이벤트를 기록한 다음 동료가이를 사용할 수 있도록보고 인터페이스를 작성해야한다는 것을 이해했습니다.

맞습니까? 내가 사용해야하는 엔진 및 프론트 엔드 /보고 도구에 대한 조언이 있습니까? 저는 파이썬 프로그래머입니다. 그래서 파이썬 친화적 인 것이 좋을 것입니다.

감사합니다.

+0

장고에는 몇 가지 해결책이 있습니다. 흥미로운 다른 질문을 찾을 수 있습니다. http://stackoverflow.com/questions/469200/any-python-olap-mdx-orm-engines – charlax

답변

2

주요 질문은 큐브의 크기가 커지거나 오픈 소스 OLAP 솔루션이 필요한지 아닌지입니다.

큰 큐브를 다루고 있고 앞으로의 기능을위한 공간을 원한다면 OLAP Server으로 갈 것입니다. 일부는 오픈 소스 - Mondrian이고 다른 커뮤니티는 '제한적'커뮤니티 에디션 - Palo, icCube입니다. 여기서 중요한 점은 MDX 및 XMLA와 호환된다는 것입니다. OLAP 표준을 수정하여 다양한보고 도구를 연결하거나 기존 라이브러리를 사용할 수 있습니다. 필자는 Java 또는 .NET과 같이 XMLA 라이브러리 용 Phyton 버전이 없다고 확신하고 있습니다.

큐브가 작 으면 Charlax의 의견이 나타내는 것처럼 다른 것으로 직접 만들거나 다른 빠른 해결책을 찾아 볼 수 있습니다.

2

선택한 답변에서 언급했듯이 데이터 양에 따라 다릅니다. 그러나 가벼운 Python OLAP 프레임 워크로 충분할 것입니다. Cubes, 소스 코드는 github입니다. 여기에는 SQL 백엔드 (구현 된 다른 백엔드)가 포함되어 있으며 조명을 제공합니다 (HTTP OLAP server). 응용 프로그램 (HTTP Slicer OLAP 서버 백엔드가있는 PHP 프론트 엔드)을 사용하는 예제는 here입니다. 시각화 계층과 복잡한 쿼리는 포함되어 있지 않지만 작게는 절충됩니다.