2017-11-25 1 views
-1

야구 선수의 키와 몸무게와 함께 .dta 형식의 데이터 세트가 있습니다. 각 개별 무게 값의 평균 높이를 계산하고 싶습니다. 찾을 수 있었기 때문에 dplyr과 "group_by"를 사용할 수는 있지만 패키지를 설치하고 호출 함에도 불구하고 내 R 스크립트는 명령을 인식하지 못합니다.개별 X 값의 평균 Y

감사합니다.

+1

다음 U는'기본 R' 방법이 aggregate' 즉'집계 (높이 ', 즉 할 ~ (df1, tapply (height, weight, FUN = mean)) ' – akrun

+0

@DespeRate -'dplyr'을 사용할 때 어떤 오류 메시지가 나타 납니까? –

+1

집계했습니다. @akrun – DespeRate

답변

1

다음은 UCLA SOCR MLB HeightsWeights 데이터 세트에서 얻은 야구 선수의 키와 무게 데이터를 사용하여베이스 R로 코딩 된 예입니다.

데이터를 정리 한 후 (한 플레이어의 무게가 누락 됨) GitHub에 게시하여 다시 정리하지 않고도 액세스 할 수있게했습니다.

theCSVFile <- "https://raw.githubusercontent.com/lgreski/datasciencedepot/gh-pages/data/baseballPlayers.csv" 
download.file(theCSVFile,"./data/baseballPlayers.csv",method="curl") 
theData <- read.csv("./data/baseballPlayers.csv",header=TRUE,stringsAsFactors=FALSE) 
aggData <- aggregate(HeightInInches ~ WeightInPounds,mean, 
       data=theData) 
head(aggData) 

... 그리고 출력은 다음과 같습니다

> head(aggData) 
    WeightInPounds HeightInInches 
1   150  70.75000 
2   155  69.33333 
3   156  75.00000 
4   160  71.46667 
5   163  70.00000 
6   164  73.00000 
> 

관련,

관련 문제