안녕하세요, 데이터가 많아서 계산해야합니다. 25 개의 열 (변수)이 있으며 각 열에는 수천 개의 값이 들어 있습니다. 그러나 누락 된 값. I 내가 각 열의 SD를 산출하고, NA - 값을 무시할 수있는 방법R : NA 값에도 불구하고 data.frame에서 cols의 표준 편차를 계산합니다.
colMeans(df, na.rm = TRUE)
와 평균 계산? @에서 언급 한 바와 같이
안녕하세요, 데이터가 많아서 계산해야합니다. 25 개의 열 (변수)이 있으며 각 열에는 수천 개의 값이 들어 있습니다. 그러나 누락 된 값. I 내가 각 열의 SD를 산출하고, NA - 값을 무시할 수있는 방법R : NA 값에도 불구하고 data.frame에서 cols의 표준 편차를 계산합니다.
colMeans(df, na.rm = TRUE)
와 평균 계산? @에서 언급 한 바와 같이
당신은 시도 할 수 apply
의 출력으로
apply(df, 2, sd, na.rm = TRUE)
매트릭스이며, 당신이 가장 가능성이 조옮김 할 것이다, 더 직접적이고 안전한 옵션은 lapply
또는 sapply
을 사용하는 것입니다 docendodiscimus,
sapply(df, sd, na.rm = TRUE)
우리는 matrixStats
에서 colSds
사용할 수 있습니다, matrix
로 변환하면
library(matrixStats)
colSds(as.matrix(df), na.rm=TRUE)
아니면 dplyr
library(dplyr)
df1 %>%
summarise_each(funs(sd(., na.rm=TRUE)))
관련에서
summarise_each
를 사용할 수 있습니다 http://stackoverflow.com/questions/20794284/means-and-sd-for-columns-in-a-dataframe -with-na-values – thelatemail