저는 R에서 일하기 시작한 의사이며이 질문에 대한 도움을 주신 의사입니다 : 변수 나이 (연속)가있는 2 개의 테이블 (A, B) , 성 (이진) 및 test_value (이진). 각 테이블에는 나이와 성별이 다릅니다.다른 변수에 따라 테이블을 샘플링
set.seed(10)
AgeA <- round(rnorm(100, mean = 40, sd = 15))
SexA <- sample(c("M","F"), 100, replace = TRUE, prob = c(0.5, 0.5))
Test_ValueA <- rbinom(100, 1, 0.3)
set.seed(20)
AgeB <- round(rnorm(1000, mean = 50, sd = 15))
SexB <- sample(c("M","F"), 1000, replace = TRUE, prob = c(0.5, 0.5))
Test_ValueB <- rbinom(1000, 1, 0.4)
A <- data.frame(Age = AgeA, Sex = SexA, Test = Test_ValueA)
B <- data.frame(Age = AgeB, Sex = SexB, Test = Test_ValueB)
genderA<-(prop.table(table(A[,2])))
TestA<-(prop.table(table(A[,3])))
paste("median age in group A is",median(A[,1]), "percentage female in group A is",genderA[1], "percentage of test positive in A is", TestA[2])
genderB<-(prop.table(table(B[,2])))
TestB<-(prop.table(table(B[,3])))
paste("median age in group A is",median(B[,1]), "percentage female in group B is",genderB[1], "percentage of test positive in A is", TestB[2])
테스트 비율의 차이는 이제 연령과 성별로 혼란 스럽습니다. 지금은 나이와 성별을 조정하기 위해 테이블 A의 환자와 테이블 B를 일치시키고 싶습니다. B가 더 작은 집단이기 때문에 나는 A에서 표본 추출을하고 B와 일치하는 것을 선호 할 것입니다. 일치하는 패키지는 옵션입니까? 다른 아이디어
잘만되면 나는 나의 문제를 설명 할 수 있었다. 이 기능이 가리킬 수있는 힌트가 있습니까?
library(dplyr)
Bsummary <- group_by(B,Sex)
Bsummary <- summarise(Bsummary, PercenteagePositive = sum(Test == 1)/length(Test == 1), PercenteageSex = n()/100)
Bsummary
경우 :
에 오신 것을 환영합니다을 갈 수 싶어합니다. [(1)] (http://stackoverflow.com/help/how-to-ask)를 읽으십시오. 좋은 질문 [[2] (http://stackoverflow.com/help/mcve) [(3)] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example#answer-5963610)뿐만 아니라 MCVE를 만드는 방법 R. – Christoph