2009-09-02 3 views
2

나는 회사 웹 사이트의 로그 테이블을 분석하는 임무를 맡았습니다. 이 표는 특정 세션에 대한 웹 사이트 전체의 사용자 클릭 경로를 포함합니다. 우리 회사는 사용자의 '클릭 경로'를 기반으로 추세를 이해/파악하려고합니다. 그렇게 할 때 연령/지역 등을 기준으로 특정 '클릭 경로'를 취하는 사용자 그룹을 식별하십시오. 당신은 제목에서 알 수 있듯이 궁금 그래서Microsoft 비즈니스 인텔리전스. 내가 할 수있는 일이 가능합니까?

, 나는 BI와 그 기능에 완전히 새로운 오전 :

  1. 우리의 목표는 달성

    있습니까?
  2. 어떻게해야합니까?

저는 현재 온라인으로 읽은 책과 다른 전자 책을 읽고 있습니다. 모든 징후는 이것이 서열 클러스터링을 통해 가능하다는 것을 암시하는 듯하다. 비록 정확한 구현과 개조가 현재 나에게 도움이되지는 않지만. 따라서 누군가가 그런 사업에서 처음으로 경험을한다면, 당신이 여기서 공유 할 수 있다면 정말 좋을 것입니다.

건배!

답변

2

찾고있는 것은 Association Rule Mining입니다. 특히 BI에 익숙하지는 않지만 및 그 변형의 여러 구현을 포함하는 Weka을 살펴 보시기 바랍니다.

0

우선 오픈 소스 또는 상업적 웹 분석 소프트웨어 패키지 (즉, 위해 구글)와 시작은 사소한

일부는 다른 테이블 매핑 데이터 (나이와 사용자 테이블을 허용 등)을 사용하거나 웹 세션 로그를 다른 데이터와 매핑하는 자체 솔루션을 혼합하십시오.

일반적인 SQL 쿼리 이외에는 분석 문제를 해결할 수 있습니다. 이중 프레임 워크에 원시 데이터를로드

select user.id 
from user, log l1, log l2, log l3 
where user.id = l1.userid and l1.type = first step 
    and user.id = l2.userid and l2.type = next step 
    and user.id = l3.userid and l3.type = last step 
    and l1.sessionid = l2.sessionid and l2.sessionid = l3.sessionid 

훨씬 쉽게 만들 수 없습니다. 이와 같은 쿼리 결과를 BI 프레임 워크에로드하면

웹 응용 프로그램에 따라 세션 ID가 오래 지속되거나 세션 ID가 변경되는 경우 actaul 세션을 식별하는 데 어려움이있을 수 있습니다. 그것이 문제인 경우 웹 애널리틱스를 실제 웹 서버 코드로 옮겨야하므로 장기 실행 상태를 시뮬레이션하여 대신 기록 할 수 있습니다.

2

기존 로그 파일에이 늘 도움 당신은 ... (하지만 답변에 대한 검색이 실패 할 경우는, 대안입니다)

Google 웹 로그 분석은 무료이며, 당신은 {연령 여러 사용자 정의 변수를 설정할 수 있습니다 , etc.} 트래픽이 어디로가는 지 확인하십시오. (개별 사용자가하는 일을 볼 수는 없습니다.))하지 않으려 고 노력하고 있지만 무료 일 뿐이며 원하는 것을 가까이서 볼 수는 없습니다.

실제로 웹 로그 분석을 원하는 경우 Omniture (비싸지 만) 복잡한 웹 사이트보고를 작성하기위한 최고 수준입니다. 많은 전자 상거래 시나리오에서 사용자가 사이트에 들어오는 방식을 추적하고 훨씬 더 많이 ~

자신을 "롤링"하기 전에 많은 웹 사이트 분석이 있으며, 그들은 자신의 목표에 집중할 수 있도록 도와 줄 수 있습니다.

+1

나는 이것을 두 번째로 줄 것이다. 작년에 BI 심판의 일부를 조사한 결과 (제대로 사용하지는 않았지만) 제대로 수행하고 싶다면 매우 가파른 학습 곡선이 있습니다. – Paddy

관련 문제