2012-12-06 2 views
2

Stack Exchange Data Explorer을 사용하여 Stack Overflow에서 상위 10 명의 응답자를 파악하려고합니다.고유 사용자의 GROUP BY가 예상보다 많은 합계를 반환합니다.

postcount OwnerUserId 
--------- ----------- 
23628  22656  
17505  29407  
12978  157882  
10863  34397  
10598  23354  
10560  17034  
9341  20862  
8600  115145  
7394  57695  
7073  1583 

문제는 다음과 같습니다 : 사용자 22656은 Jon Skeet, 그리고 그의 profile says he has 23,702 answers이 내 결과이며,

SELECT TOP 10 COUNT (PostTypeId) postcount, OwnerUserId 
FROM Posts 
WHERE PostTypeId = '2' AND OwnerUserId IS NOT NULL 
GROUP BY OwnerUserId 
ORDER BY postcount DESC 

그리고이 내 쿼리입니다.

나는 다른 사람을 검사했다 : Darin Dimitrov는 사용자 29407이다. 그의 단면도는 그가 17,525 answers, 다만 17,505가다는 것을 나타낸다. 나머지는 모두 비슷하게 비뚤어집니다.

postcount에 총계 수가 잘못 되었습니까? 이 문제를 어떻게 해결할 수 있습니까?

답변

5

다이아몬드가 있고 삭제 된 답변을보고 있기 때문에 Jon의 프로필에 대한 답변이 더 많이 표시됩니다.

"23,702 답변"이 검색어에 의해보고 된 값에 더 가깝습니다.

불일치의 나머지 부분은 데이터 탐색기가 분 단위로 업데이트되지 않으므로 사람들이 더 많은 콘텐츠를 추가한다고 가정 할 때 항상 더 낮은 합계를보고합니다.

관련 문제