2014-10-12 3 views
0

가중치 적용 데이터가있는 OLS를 사용하여 고정 효과 모델을 실행하고 싶습니다.R : 가중치가있는 고정 효과 모델을 계산하는 방법

약간의 혼란이있을 수 있기 때문에 경제학자들이 일반적으로 "모델 내"또는 다른 말로 개별적인 효과를 내포한다는 의미에서 "고정 효과"를 사용했다는 것을 의미합니다. 내가 실제로 가지고있는 것은 "다단계"데이터, 즉 개인의 관찰이며, 나는 그들의 원산지를 제어하고 (대응하는 클러스터 된 표준 오류를 가짐) 싶습니다.

샘플 데이터 : 내가 추정하고 싶은 모델의

library(multilevel) 
data(bhr2000) 
weight <- runif(length(bhr2000$GRP),min=1,max=10) 
bhr2000 <- data.frame(bhr2000,weight) 
head(bhr2000) 
    GRP AF06 AF07 AP12 AP17 AP33 AP34 AS14 AS15 AS16 AS17 AS28 HRS RELIG weight 
1 1 2 2 2 4 3 3 3 3 5 5 3 12  2 6.647987 
2 1 3 3 3 1 4 3 3 4 3 3 3 11  1 6.851675 
3 1 4 4 4 4 3 4 4 4 2 3 4 12  3 8.202567 
4 1 3 4 4 4 3 3 3 3 3 3 4 9  3 1.872407 
5 1 3 4 4 4 4 4 3 4 2 4 4 9  3 4.526455 
6 1 3 3 3 3 4 4 3 3 3 3 4 8  1 8.236978 

종류는 다음과 같습니다

AF06_ij = beta_0 + beta_1 AP34_ij + alpha_1 * (GRP == 1) + alpha_2 * (GRP==2) +... + e_ij 

나는 특정 indidividuals를 참조 j는 그들이 속한 그룹을 참조 곳.

또한, 관측치가 weight (샘플링 가중치)으로 가중되고 싶습니다.

그러나 가능한 GRP 별 이분 산성을 반영하기 위해 "클러스터 된 표준 오류"를 얻고 싶습니다. 즉, E(e_ij)=0이지만 Var(e_ij)=sigma_j^2인데, 여기서 Σ_j는 각각 GRPj에 대해 다를 수 있습니다.

정확하게 이해 한 경우 nlmelme4은 임의 효과 모델 (또는 소위 혼합 모델) 만 예상 할 수 있지만 내부의 의미는 고정 효과 모델이 아닙니다.

내가하고 싶은 일에 이상적이었던 패키지 을 사용해 보았지만 가중치를 허용하지 않았습니다. 다른 생각?

+0

질문 SO에 대한 최소한 "너무 막연한"로 라인을 통해 정말. 그러한 질문을하는 장소 중 하나에서 일반적인 통계적 조언을 받아야합니다. –

+0

네 말이 맞아. 나는 내가하고 싶은 것을 더 분명하게하기 위해 나의 질문을 수정했다. 감사! – Peutch

+0

여기 고정/무작위 효과에 대한 흥미로운 독서가 있습니다. http://andrewgelman.com/2005/01/25/why_i_dont_use/ – miles2know

답변

0

lfe 패키지를 확인하십시오. econ 스타일의 고정 효과가 있으며 클러스터링을 지정할 수 있습니다.

+0

John, 고맙습니다.하지만 lfe를 사용하여 샘플링 가중치를 지정하는 방법을 찾을 수 없습니다. 내가 뭐 놓친 거 없니? – Peutch

2

저는 이것이 스택 교환 질문에 더 가깝지만, 모델 가중치가있는 고정 효과는 제외하고 생각합니다. 순서가 지정된 범주 응답 변수에 OLS를 사용해서는 안됩니다. 이것은 순서화 된 물류 모델링 유형의 분석입니다. 그래서 아래에 당신이 제공 한 데이터를 사용하여 그 중 하나에 맞 춥니 다.

우리는 순서가 지정된 범주적인 응답 "AF06"과 두 가지 예측자를 가지고 있습니다. 첫 번째 "AP34"는 정렬 된 범주 형 변수입니다. 두 번째 "GRP"는 고정 효과입니다. 그래서 일반적으로 문제의 변수를 RHS의 요소로 강요하여 그룹 고정 효과를 만들 수 있습니다 ... (통계적 이론에서 벗어나려고 정말 노력하고 있습니다. 부정확 한 말)

아래의 코드는 polr (proportional odds logistic regression) 기능을 사용하여 주문한 물류 모델에 맞습니다. 나는 당신이 모델 사양의 관점에서 무엇을하려고했는지 해석하려고 노력했지만, 결국 OLS는 올바른 방법이 아닙니다. coefplot에 대한 호출은 매우 혼잡 한 y 축을 가질 것입니다. 여러분이 이것을 해석 할 수있는 방법에 대해 아주 기초적으로 시작하고 싶었습니다. 나는 이것을 더 세련된 방식으로 시각화하려고 노력할 것이다. 그리고 해석으로 돌아가서 ... 당신은 그것에 대해 연구 할 필요가있을 것입니다, 그러나 이것은 일반적으로 올바른 방법이라고 생각합니다. 제가 생각할 수있는 가장 좋은 자료는 Gelman과 Hill의 "회귀 및 다중 레벨/계층 모델을 사용한 데이터 분석"5 장과 6 장입니다. 정말 좋은 자료입니다. 앞으로이 유형의 분석에 관심이 있다면 전체 내용을 읽고 마스터하는 것이 좋습니다.데이터가없는, 구체적인 문제 설명하고, 다른 패키지에 대한 추천과 일 예를 모두 요구와


    library(multilevel) # To get the data 
    library(MASS) # To get the polr modeling function 
    library(arm) # To get the tools, insight and expertise of Andrew Gelman and his team 

    # The data 
    weight <- runif(length(bhr2000$GRP),min=1,max=10) 
    bhr2000 <- data.frame(bhr2000,weight) 
    head(bhr2000) 

    # The model 
    m <- polr(factor(AF06) ~ AP34 + factor(GRP),weights = weight, data = bhr2000, Hess=TRUE, method = "logistic") 
    summary(m) 
    coefplot(m,cex.var=.6) # from the arm package 
관련 문제