2014-01-26 3 views
0

의 가중치 인자 난 영역 (인자) 등이 웨이트마다 관찰 나타내는 변수를 가지고있다. 각 지역에 얼마나 많은 관찰이 있는지 알고 싶으면 summary (df $ region)를 사용합니다. 제가 알고 싶은 것은 각 관측치의 가중치를 고려하여 각 지역의 크기를 어떻게 알 수 있습니까? 사전에R - 문제는 데이터 프레임 (DF)에 <p>R.</p> 관한

감사

답변

0

당신은 (나는 이것이 당신이 무슨 뜻인지 생각하지만 내가 오해하는 경우 명확히하시기 바랍니다) 지역에 따라 가중치 합계를 tapply을 사용할 수 있습니다 : 당신이 실제로 어떤을 원하는 경우에

> df <- data.frame(region=sample(levels(state.region), 200, rep=T), weight=runif(200)) 
> summary(df$region) 
North Central  Northeast   South   West 
55   46   49   50 
> with(df, tapply(weight, region, sum)) 
North Central  Northeast   South   West 
27.73835  23.23487  24.71656  26.11786 

metric * weight이면 tapply 문을 첫 번째 인수로 weight 대신 weight * metric이되도록 수정할 수 있습니다.