1 = 동의/0 = 일치하지 않는 여러 질문 (열)이 포함 된 설문 데이터 프레임이 있습니다. 응답자 (행)는 연령대 ("젊은", "중간", "이전"), "지역"("동", "중", "서") 등의 메트릭에 따라 분류됩니다. (3 세, 3 지역, 2 성별, 11 직업 등). 각 측정 항목 내에서 카테고리는 겹치지 않고 크기가 다릅니다. 말에 응답이, 서쪽은 Q15a를 들어, 전체 표본에서 유의 한 차이가있는 경우카테고리와 열을 가로 지르는 카이 제곱 자동화
가n<-400
set.seed(1)
data<-data.frame(age=sample(c('young','middle','old'),n,replace=T),region=sample(c('East','Mid','West'),n,replace=T),gender=sample(c('M','F'),n,replace=T),Q15a=sample(c(0,1),n,replace=T),Q15b=sample(c(0,1),n,replace=T))
내가 함께, 테스트 카이 제곱을 사용할 수 있습니다
이
은 데이터 세트의 컷 다운 버전을 시뮬레이션 :attach(data)
chisq.test(table(subset(data,region=='West')$Q15a),p=table(Q15a),rescale.p=T)
내가 Q15a의 총 샘플에 대해 모든 범주를 테스트하려면, 다음 ~ 20 개 다른 질문. 문제 당 약 30 건의 테스트가 있기 때문에이를 자동화하는 방법을 찾고 싶습니다. 그러나이 방법 자체를 수행하는 방법이나 카테고리를 순환하는 루프 작성 방법을 찾는 데 어려움을 겪고 있습니다. 필자는 [1]을 검색하여 pairwise.prop.test()와 쌍 비교 테스트를 시도했지만 실제로는 아직 답을 찾지 못했습니다.
[1] 유사하지만 질문 (모두 열 현명한 시험)과 중복되지 :이 방법에 대해
Using loops to do Chi-Square Test in R
Chi Square Analysis using for loop in R
최소한의 재현 가능한 예를 제공하는 것이 가장 좋을 것이라고 생각합니다. http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example –
추가 할 질문을 편집했습니다. –