2016-07-29 4 views
0

내 데이터를 요약하면 다음과 같습니다정렬 출력 ::

head(sassign %>% select(child,youth,cook,do_it)) 
    child youth cook do_it 
1  3  2 2  0 
2  0  1 0  1 
3  0  0 2  0 
4  0  0 0  0 
5  0  0 1  0 
6  0  1 0  0 

내 목표는 사람들의 총 #을 찾는 것입니다 (sassign 데이터를 보유하고있는 data.frame입니다) 누가 어린이 책, 청소년 도서, 요리 책과 do_it 책을 샀다.

그래서, 여기에 내가 무슨 짓을했는지 : 여기

sassign %>% summarise(sumchild=sum(child),sumyouth=sum(youth),sumcook=sum(cook),sumdo_it=sum(do_it)) 

은 내가 가진 출력입니다 :

sumchild sumyouth sumcook sumdo_it 
1 42723 19549 46830 23153 

질문 1 : 이것은 나의 목적을 해결하지만, 어쨌든 나는이 정리 될 수있다 열 단위 출력? 여기에 내가 STATA에서 가져온 내용은 ​​다음과 같습니다

-------------------------------------------------------------- 
    | Total Std. Err. [95% Conf. Interval] 
    -------------+------------------------------------------------ 
    cook | 46830 265.0706 46310.46 47349.54 
    child | 42723 250.4739 42232.07 43213.93 
    do_it | 23153 171.2552 22817.34 23488.66 
    youth | 19549 152.7226 19249.66 19848.34 

위에서 볼 수 있듯이, STATA 출력이 잘 위에서 아래로 정렬됩니다.

질문 2 : 어쨌든 STATA가 보여주는 것처럼 SD 및 CI를 포함시킬 수 있습니까?

질문 3 : 어쨌든 나는 R에서 합계 대신 SD 또는 CI를 정렬 할 수 있습니까? 설명 기능을 살펴 보았지만 확신 할 수는 없으므로 여기에서 직접 묻는 것이 좋습니다.

나는 Stata에서 R로 전환하고 있으므로 얻을 수있는 도움에 감사 할 것입니다. 나는 또한 다른 게시물을 살펴 보았지만 대부분 group_by를 사용할 때 순서를 처리합니다.

감사

+1

정렬을 사용 하시겠습니까? sassign %> 요약 (sumchild = sum (child), sumyouth = sum (청소년), sumcook = sum (요리사), sumdo_it = sum (do_it)) %> % sort (감소 중 = T) – biomiha

+0

감사합니다. 이것은 도움이됩니다. 그러나 내가 SD와 CI를 포함 할 수 있는지 알고 있습니까? 한 가지 방법은 요약 할 때 SD()를 사용하는 것이지만 많은 변수가있는 경우 500 SD가 필요합니다. 이견있는 사람? – watchtower

+0

많은 컬럼에 대해 많은 통계를 계산하려면'summarise_all' /'summarise_each'를보십시오. – aosmith

답변

3

당신이 그들을 rbind 다음 데이터 프레임에 넣어, 통계를 계산, 데이터를 통해 루프 lapply을 사용할 수 있습니다, 정렬 부분은 dplyr에서 arrange 기능을 사용하여 수행 할 수 있습니다 :

library(dplyr) 
do.call(rbind, lapply(df, function(col) { 
    t.result = t.test(col); 
    data.frame(SUM = sum(col), SD = sd(col), 
       CIL = t.result$conf.int[1], CIH = t.result$conf.int[2]) })) %>% 
    add_rownames(var = "CAT") %>% arrange(desc(SUM)) 

# Source: local data frame [4 x 5] 

#  CAT SUM  SD  CIL  CIH 
# <chr> <int>  <dbl>  <dbl> <dbl> 
# 1 cook  5 0.9831921 -0.1984635 1.865130 
# 2 youth  4 0.8164966 -0.1901939 1.523527 
# 3 child  3 1.2247449 -0.7852909 1.785291 
# 4 doit  1 0.4082483 -0.2617636 0.595097