2011-12-27 1 views
1

Google 애드 센스 통계를 관리의 내 게시물 세부 정보 옆에 통합하는 사이드 바를 개발 중입니다.analytics api 샘플 데이터가있는 이상한 결과

Google Analytics API를 이해하기 위해 Google에서 제공 한 data feed query explorer을 사용하여 몇 가지 테스트를 수행했습니다.

몇 가지 테스트를 거친 후에 나는 실용적인 예제로 다시 시작할 수있는 이상한 행동을 발견했습니다. 어떤 키워드가 사람들을 특정 URL로 데려 왔는지 알고 싶습니다.이 키워드 중 몇 개를 클릭했는지 알고 싶습니다. 나는 데이터를 검색 할 때

ids   = <myTableId> 
dimensions = ga:keyword 
metrics  = ga:visits 
segment  = 
filters  = ga:pagePath=~<myUrl>$ 
sort  = 
start-date = 
end-date = 
start-index = 
max-results = 
max-results = 50 

: 이것은 사용되는 파라미터 세트가

매일 키워드, 월간 키워드와 전체 키워드 ... : 나는 또한 3이 개 정보에 대해 서로 다른 데이터 범위를 원한다 하루 (예 : start-date = 2011-12-27end-date = 2011-12-27) 모든 것이 제대로 작동하는 것처럼 보입니다. 난 내 시간 범위 내가 이상한 행동을하기 시작 확장 할 경우

ga:keyword                  ga:visits 
---                    ---  
(not set)                  1 
lo schiaccianoci film a roma        1 
lo schiaccianoci film programmazione roma 1 
lo schiaccianoci film roma          1 
lo schiaccianoci programmazione a roma   1 
programmazione film lo schiaccianoci a roma 1 
schiaccianoci film programmazione      1 
schiaccianoci film roma          1 

:

내 URL /programmazione/lo-schiaccianoci-in-3d-andrei-konchalovsky-2-dicembre-2011.film에 대한 예를 들어, 나는 다음과 같은 결과를 얻었다. 이전 요청의 같은 달의 하루 종일 요청을 연장하면 적어도 하루 동안 검색된 모든 키워드 (클릭 수가 많을 수 있음)가있을 것으로 예상되지만 어쨌든 결과는 더 적습니다 (또한 심지어 악화

ga:keyword            ga:visits  
---              --- 
(not set)           31 
lo schiaccianoci film roma 2011 31 

내가 현재 하루 페이지를 생성 첫날부터 (를 allover 데이터를 검색하려고하면) : 경고) "이 결과는 샘플링 된 데이터을 기반으로"말한다 : 데이터가 없습니다!

그래서 내 접근 방식에 문제가 있습니까?

--- 업데이트 --- 나는이 버그 리포트 발견

: http://code.google.com/p/analytics-issues/issues/detail?id=160 당신이 관련이 생각하십니까를?

답변

3

데이터가 샘플링되는 경우 품질이 매우 떨어집니다. 샘플링은 총 방문수를 기반으로 한 것처럼 보입니다. 따라서 요청을 더 짧은 기간으로 줄이면 일반적으로 샘플링이 제거됩니다. 하루에 한 번만 데이터를 요청하면이 문제가 발생했습니다.

문제를 해결하려면 직접 여러 요청을하고 집계해야합니다. 이는 의미가 없지만 문제를 해결할 수있는 유일한 방법입니다. 결과 세트의 샘플 플래그를 확인하고 시간을 줄이고 모든 클린 데이터를 얻을 때까지 루프에서 다시 요청합니다.

내 자신의 분석에 따르면 샘플링 된 방문수의 40 %가 샘플링되지 않은 값에서 5 % 이상 떨어져 있습니다. 그것은 방문을위한 것입니다. 순 방문자는 샘플링에서 계산되지 않으며 (방문수 만 반환), 전환과 같은 더 작은 데이터 요소는 더욱 불규칙 해집니다.

+0

이것은 정말 분명하고 만족스러운 답변입니다! 고맙습니다 ... 내 경우에는 (적어도 2 일 범위를 사용하여 샘플링 된 데이터를 받기 때문에 30/31 요청을해야하는 월간 데이터를 검색하기 위해) 많은 요청을 할 수 없으므로 대략적인 데이터를 유지하기 위해 ... –

+0

나는 모든 일을 하루 범위로 할 것을 권한다.Google은 API에 매일 수천 건의 요청을 허용 할 것이므로이 이유 때문에 모자를 쓰지 않을 것이라고 생각합니다. – bkgraham