내 데이터를 요약하면 다음과 같습니다정렬 출력 ::
head(sassign %>% select(child,youth,cook,do_it))
child youth cook do_it
1 3 2 2 0
2 0 1 0 1
3 0 0 2 0
4 0 0 0 0
5 0 0 1 0
6 0 1 0 0
내 목표는 사람들의 총 #을 찾는 것입니다 (sassign 데이터를 보유하고있는 data.frame입니다) 누가 어린이 책, 청소년 도서, 요리 책과 do_it 책을 샀다.
그래서, 여기에 내가 무슨 짓을했는지 : 여기
sassign %>% summarise(sumchild=sum(child),sumyouth=sum(youth),sumcook=sum(cook),sumdo_it=sum(do_it))
은 내가 가진 출력입니다 :
sumchild sumyouth sumcook sumdo_it
1 42723 19549 46830 23153
질문 1 : 이것은 나의 목적을 해결하지만, 어쨌든 나는이 정리 될 수있다 열 단위 출력? 여기에 내가 STATA에서 가져온 내용은 다음과 같습니다
--------------------------------------------------------------
| Total Std. Err. [95% Conf. Interval]
-------------+------------------------------------------------
cook | 46830 265.0706 46310.46 47349.54
child | 42723 250.4739 42232.07 43213.93
do_it | 23153 171.2552 22817.34 23488.66
youth | 19549 152.7226 19249.66 19848.34
위에서 볼 수 있듯이, STATA 출력이 잘 위에서 아래로 정렬됩니다.
질문 2 : 어쨌든 STATA가 보여주는 것처럼 SD 및 CI를 포함시킬 수 있습니까?
질문 3 : 어쨌든 나는 R에서 합계 대신 SD 또는 CI를 정렬 할 수 있습니까? 설명 기능을 살펴 보았지만 확신 할 수는 없으므로 여기에서 직접 묻는 것이 좋습니다.
나는 Stata에서 R로 전환하고 있으므로 얻을 수있는 도움에 감사 할 것입니다. 나는 또한 다른 게시물을 살펴 보았지만 대부분 group_by를 사용할 때 순서를 처리합니다.
감사
정렬을 사용 하시겠습니까? sassign %> 요약 (sumchild = sum (child), sumyouth = sum (청소년), sumcook = sum (요리사), sumdo_it = sum (do_it)) %> % sort (감소 중 = T) – biomiha
감사합니다. 이것은 도움이됩니다. 그러나 내가 SD와 CI를 포함 할 수 있는지 알고 있습니까? 한 가지 방법은 요약 할 때 SD()를 사용하는 것이지만 많은 변수가있는 경우 500 SD가 필요합니다. 이견있는 사람? – watchtower
많은 컬럼에 대해 많은 통계를 계산하려면'summarise_all' /'summarise_each'를보십시오. – aosmith