2012-11-21 5 views
0

Google 사이트의 성장에 따라 Google 애널리틱스의 데이터 안정성이 떨어지고 있습니다.컬렉션 샘플링은 Google 웹 로그 분석의 '실시간'통계에 어떤 영향을 줍니까?

우리가 가장 강하게 알아 낸 장소 중 하나는 "실시간 대시 보드"입니다.

우리가 하루에 30k 명의 사용자를 얻었을 때 한 번에 한 줄씩 500-600 명이 나타납니다. 이제 하루에 50,000 명의 사용자가 방문하고 있으므로 한 번에 한 줄에 200-300 명이 나타납니다.

(사용자 행동이 많이 변경되지 않은 우리의 제품 쇼 내에서 다른 사용자 메트릭! 어떤 사용자가 현재 어느 때보 사이트에 더 이상 지출하는 경우)

매일 합계를 분석에 여전히 상승 , 그래서 그것은 히트 나 무언가를 놓치고있는 것과는 다르다. 아무나 어떤 생각을 가지고 있니?

답변

0

내가 생각할 수있는 유일한 점은 아마도 사용자가 온라인 상태에있는 것이 무엇인지에 대한 해석에 차이가 있다는 것입니다.

사용자가 온라인 상태인지 어떻게 판단합니까?

명시 적 로그인/로그 아웃 추적이 없으면 X 초 간격으로 사용자 생성 이벤트 나 브라우저의 요청이없는 경우 사용자가 갔다고 가정 할 수 있습니까?

그럴 경우 숨겨진 iframe에 매 초마다 요청을 계속 보내는 자바 스크립트 코드를 추가하는 것이 좋습니다.

+0

그래, 우리는 이미 다른 이유로이 때문에 매분 '하트 비트'를 보냈습니다. 그러나 더 큰 관심사는 실제 사용자 수와 일치하지 않는보고 된 사용자 수가 갑자기 * 변경된 이유입니다. – Ipsquiggle

0

순 사용자의 동시 측정 값을 순 사용자의 다른 시간 조각과 비교할 수 없습니다.

예를 들어 1000 명의 사람들이 하루 동안 10 명 이었으므로 소수의 동시 고유 사용자 (예 : 10)와 1000보다 훨씬 높은 일일 순 사용자 수를 가질 수있었습니다 주어진 시간. 동시 사용자 수는 매일의 순 쿠키 수와 상관 관계가 없으므로 하루 동안의 분포가 고르지 않을 수 있으며 거의 ​​사과와 오렌지입니다.

이것은 월간 고유 및 일일 순 쿠키 수를 조합 할 수없는 것과 같은 방식이지만 평균 순 쿠키 수는 월간 순 쿠키 수의 하한값과 같습니다.

관련 문제