을 사용하여 다중 수준 회귀 분석을위한 올바른 방법 10 개국 (레벨 2)의 300 개 기업 (1 단계)에 대한 데이터가 있다고 가정 해 보겠습니다. 레벨 1 변수는 PQ 및 크기입니다. 2 단계 변수는 1 인당 GDP입니다. 나는이 프로그램을 실행할 때lmer [R]
library(lme4)
set.seed(1)
PQ <- runif(300,7,21)
id <- (1:300)
country <- sample(1:10,300,replace=T)
size <- sample(1:25000,300,replace=T)
GDP <- sample(800:40000,10,replace=T)
Country1 <- 1:10
L1data <- as.data.frame(cbind(id,country,PQ,size))
L2data <- as.data.frame(cbind(Country1,GDP))
MLdata <- merge(L1data,L2data, by.x = "country", by.y = "Country1")
dummymodel <- lmer(PQ ~ size + GDP + (size|country), data = MLdata, REML = F)
나는 경고 메시지를
경고 메시지를 얻을 : 1 : 일부 예측 변수는 매우 다른 저울 : 2를 스케일링 고려 : checkConv (ATTR (opt에 "derivs"), opt $ par, ctrl = control $ checkConv, 모델이 과 수렴하지 못함 max | grad | = 1.77081 (tol = 0.002, 구성 요소 1) 3 : 에서 checkConv (attr (opt, "derivs"), opt $ par, ctrl = control $ checkConv, :
모델은 거의 식별 할 수 없습니다 : 매우 큰 고유 값 - 변수 크기 재조정? 모델은 거의 식별 할 수 없습니다 : 큰 고유 값 비율 - 변수 크기 재 지정?
내가 추가 경고 메시지가 원본 데이터와 모델을 실행할 때 사실 :
모델은 수렴하지 못했습니다 퇴화 독일인 1 개 음의 고유
내가 추측과 이 문제를 해결하기 위해 독립 변수의 크기를 조정해야합니다. 이와 같이 다단계 회귀 분석에서 올바른 척도는 무엇입니까? 멀티 레벨 모델의 결과가 스케일링에 의존하기 때문에이 질문은 중요합니다. 아니면 내가 찾을 수없는 다른 문제가 있습니까?
모든 변수'as.data.frame (scale (MLdata)) '을 스케일 한 후에 모델이 올바르게 맞춰졌습니다. –
감사합니다. 멀티 레벨에서 이와 같이 데이터를 스케일링하는 것이 이론적으로 유효한가? 각 레벨별로 설명 된 결과와 분산은 스케일링으로 인해 상당한 변화가 있습니다. –