나는 약간의 통계적 문제가있는 천재적인 SQL 도움말을 찾고 있습니다.SQL 통계 샘플링
나는 사용자 프로필의 불균형 그룹에서 통계적으로 균형 잡힌 샘플을 추출합니다. 한 번에 단일 프로필 속성 (예 : 성별)에 대해이 작업을 수행하는 것은 다소 간단합니다. 그러나 한 번에 여러 차원에서이를 수행하려면 정교함이 필요합니다.
논의를 위해이 표가 있다고 가정 해 보겠습니다.
Profile.userID
Profile.Gender
Profile.Age
Profile.Income
나는 사용자의 새로운 샘플링은 대략 다음과 같은 특징이 모두 일치하도록 믹스에서 프로파일의 풀을 당겨하려면 :
이50% male, 50% female
30% young, 40% middle age, 40% old
40% low income, 40% middle income, 20% high income
사람이하는 방법에 대한 아이디어가 있습니까 이걸 풀어 줘?
샘플 세트가 사양을 충족 할 때까지 한 번에 하나씩 임의로 레코드를 임의로 잡아 당기는 것을 방지하려면? –
계속해서 균형을 잃지 않게하려면 어떻게해야합니까? 한 번 더 여성 레코드가 필요하다고 말하면, 그 레코드를 당기면 내 나이와 수입이 균형을 잃게됩니다 ...? – tbacos
30 % 젊음, 40 % 중년, 40 % 예! = 100 % 너의 범위에서 젊은 나이와 중년 나이가 겹치나요? –