2017-12-01 2 views
0

여기 몇 가지 종단 데이터를 만들었습니다. 변수 결과는 환자의 바이오 마커 수준입니다. 변수 방문 방문 레이블을 나타냅니다. 가변 시간은베이스 라인 t1로부터의 일을 의미한다. 응답 상태에는 '예'와 '아니오'의 두 가지가 있습니다. 내가 알고 싶은 것은 시간 경과에 따라 응답자와 비 응답자간에 바이오 마커 수준에 차이가 있는지 여부입니다.종단 데이터의 선형 혼합 모델 : 연속 된 시간 대 정렬되지 않은 계수 대 정렬 된 계수

분석을 위해 선형 혼합 모델을 사용합니다.

#generate data  
df = data.frame(result = rnorm(200)+2, 
      visit = rep(c('t1', 't2', 't3', 't4', 't5'), 40), 
      time = rep(c(0, 8, 14, 30, 60), 40), 
      response = rep(c('yes', 'no'), each=100), 
      id = rep(1:40, each=5)) 

# run lme model 
library(lme4) 
library(lmerTest) 
lmer(result~time*response+(1|id),data=df) 
lmer(result~factor(visit)*response+(1|id), data=df) 
lmer(result~factor(visit, ordered=TRUE)*response+(1|id), data=df) 

내 질문은 :이 분석에서 1. 나는 시간 (연속) 또는 방문 (요인)를 사용해야합니까?
2. 방문 (요인)을 사용하는 경우 주문했거나 순서를 지정해야합니까? 사용할 유형 시간 변수 (요인 대 지속)를 선택하는 데 지침이 있습니까?

감사합니다.

답변

0

... 방문 시간을 연속 변수 또는 요인으로 처리해야합니까?

나는 당신이 (정확하게?) 동일 기간의 관측에서 동일한 무작위 효과 용어를 사용하기를 원하기 때문에 요인이 올 수 있습니다. 그러나 모든 방문 수준과 time이 동시에 빠지면 이는 visits에 임의의 효과가있는 것과 같습니다. 내가 예를 들어, 이후에 문제가 파악 불구하고 그들은 당신의 예에서하지, id = 2 시간에 그것의 주먹 방문이 t = 60

> df[df$id == 2, ] 
     result visit time response id 
5 1.84451763 t1 60  no 2 
6 1.30286252 t2 0  no 2 
7 0.40109211 t3 8  no 2 
8 -0.01516773 t4 14  no 2 

나는 대안은 각 개인이 임의의이있는 경우 (time|id) 같은 것 같아요 슬로프 또는 (time|response)인데,이 경우 두 응답 범주는 각각 임의의 기울기를 갖습니다. 그것은 귀하의 신청서에 의미가있을 수 있습니까?

+0

미안해 데이터 세트를 생성하는 데 실수를했습니다. 방금 고쳤습니다. 각 방문은 특정 시간에 해당합니다. 변수로 방문 (요소) 또는 시간 (연속)을 사용해야합니까? @ 벤자민 크리스토퍼슨 – zesla