0
비례 샘플링 I는 다음과 같은 데이터 세트가 생성 가지고층화 추출법 또는 R
myData <- data.frame(a=1:N,b=round(rnorm(N),2),group=round(rnorm(N,4),0))
데이터의 모양 등이
I는 성층 샘플 세트를 생성하고자 주어진 샘플 크기, 즉, 50을 가진 myData
의 결과 샘플 세트는 "그룹"에 대한 원래 데이터 세트의 비율 배분을 따라야합니다. 예를 들어, myData
그룹 4에 속하는 20 개 기록, 그 결과 데이터 세트가 50*20/200=5
기록으로 값 < 1을 지정, R.
아난다, 감사합니다. 귀하의 코드에 관한 질문이 있습니다. <- lapply ( names (df.split), function (x) df.split [[x]] [sample (df.table [x], n [x] = replace),]) 대체품으로 샘플링하는 것처럼 보입니다. 이로 인해 중복 샘플이 발생할 수 있습니다. 그게 맞습니까? – user288609
@ user288609 무엇이 문제입니까? :-) 그 시점까지 모든 코드는 지층 당 샘플 크기를 결정하는 것입니다. 이것이 샘플링이 실제로 이루어지는 단계입니다. 그룹별로 분리 된 'data.frame'을 순환하며 각 하위 집합에서 필요한 수의 행을 샘플링합니다. – A5C1D2H2I1M1N2O1R2T1
@ user288609, no. 함수를 호출 할 때'replace = TRUE'가 아니면 안됩니다. (미안, 귀하의 질문에 내 코멘트를 쓰고 시작했을 때 거기에 없었어요.) – A5C1D2H2I1M1N2O1R2T1