-1
야구 선수의 키와 몸무게와 함께 .dta 형식의 데이터 세트가 있습니다. 각 개별 무게 값의 평균 높이를 계산하고 싶습니다. 찾을 수 있었기 때문에 dplyr과 "group_by"를 사용할 수는 있지만 패키지를 설치하고 호출 함에도 불구하고 내 R 스크립트는 명령을 인식하지 못합니다.개별 X 값의 평균 Y
감사합니다.
야구 선수의 키와 몸무게와 함께 .dta 형식의 데이터 세트가 있습니다. 각 개별 무게 값의 평균 높이를 계산하고 싶습니다. 찾을 수 있었기 때문에 dplyr과 "group_by"를 사용할 수는 있지만 패키지를 설치하고 호출 함에도 불구하고 내 R 스크립트는 명령을 인식하지 못합니다.개별 X 값의 평균 Y
감사합니다.
다음은 UCLA SOCR MLB HeightsWeights 데이터 세트에서 얻은 야구 선수의 키와 무게 데이터를 사용하여베이스 R로 코딩 된 예입니다.
데이터를 정리 한 후 (한 플레이어의 무게가 누락 됨) GitHub에 게시하여 다시 정리하지 않고도 액세스 할 수있게했습니다.
theCSVFile <- "https://raw.githubusercontent.com/lgreski/datasciencedepot/gh-pages/data/baseballPlayers.csv"
download.file(theCSVFile,"./data/baseballPlayers.csv",method="curl")
theData <- read.csv("./data/baseballPlayers.csv",header=TRUE,stringsAsFactors=FALSE)
aggData <- aggregate(HeightInInches ~ WeightInPounds,mean,
data=theData)
head(aggData)
... 그리고 출력은 다음과 같습니다
> head(aggData)
WeightInPounds HeightInInches
1 150 70.75000
2 155 69.33333
3 156 75.00000
4 160 71.46667
5 163 70.00000
6 164 73.00000
>
관련,
렌
다음 U는'기본 R' 방법이 aggregate' 즉'집계 (높이 ', 즉 할 ~ (df1, tapply (height, weight, FUN = mean)) ' – akrun
@DespeRate -'dplyr'을 사용할 때 어떤 오류 메시지가 나타 납니까? –
집계했습니다. @akrun – DespeRate