2015-01-23 4 views
0

다음과 같은 문제가 있습니다 : 두 개의 열이있는 data.frame이 있습니다. 나는 x '의 그룹화 된 가치에 대한 y의 평균을 발견 할 것이다 [hrbrmstr의 공식]. 예 :그룹화 된 값 x 단위의 평균을 찾습니다.

x <- c(1,4,4,2,1,3,4,2,3,4) 
y <- c(2.23,5.56,5.53,3.32,2.32,4.21,5.60,3.43,4.32,5.59) 
my.data <- data.frame(x,y) 

> my.data 
x y 
1 1 2.23 
2 4 5.56 
3 4 5.53 
4 2 3.32 
5 1 2.32 
6 3 4.21 
7 4 5.60 
8 2 3.43 
9 3 4.32 
10 4 5.59 

내가 계산하면 수동은 다음과 같습니다

xx <- c(1,2,3,4) 
yy <- c(mean(c(2.23,2.32)),mean(c(3.32,3.43)),mean(c(4.21,4.32)),mean(c(5.56,5.53,5.60,5.59))) 
my.data.corr <- data.frame(xx,yy) 

결과 data.frame은 다음과 같아야합니다

> my.data.corr 
xx yy 
1 1 2.275 
2 2 3.375 
3 3 4.265 
4 4 5.570 

결과에 XX의 순서는 중요하지 않습니다 .

도움 주셔서 감사합니다.

+0

각 'x'값에 대해 첫 번째 'y'를 사용하는 것으로 보입니다. 그게 맞습니까? – thelatemail

답변

4

그룹화 된 값인 x에 대해 y의 평균을 찾으려면 예제 출력이 잘못되었습니다.

library(dplyr) 

my.data %>% 
    group_by(x) %>% 
    summarise(yy=mean(y)) 

## x yy 
## 1 1 2.275 
## 2 2 3.375 
## 3 3 4.265 
## 4 4 5.570 

다른 작업을 수행하려는 경우 질문을 다시 입력하십시오.

+1

그게 내가 원하는거야! 우리 계산 결과가 왜 다른지 이해가되지 않더라도 결과가 다릅니 까? – Hans

+0

당신은 완전합니다! 내 실수는 'mean (c (4.21,4.32))'대신 'mean (4.21,4.32)'을 사용했고, 미안해하고 대답 해 주셔서 감사합니다! – Hans

관련 문제