나는 약 3,000 행의 데이터 세트를 가지고 있습니다. 데이터는 https://pastebin.com/i4dYCUQXdplyr의 집계() 및 집계 : NA 값
을 통해 액세스 할 수 있습니다. 문제 : NA는 데이터에 NA가없는 것처럼 보이지만 결과는 출력됩니다. 여기에 내가 dplyr 또는 집계를 통해 열의 각 항목에 총 가치의 합계를하려고 할 때 발생하는 것입니다 :
example <- read.csv("https://pastebin.com/raw/i4dYCUQX", header=TRUE, sep=",")
example
# dplyr
example %>% group_by(size) %>% summarize_at(vars(volume), funs(sum))
Out:
# A tibble: 4 x 2
size volume
<fctr> <int>
1 Extra Large NA
2 Large NA
3 Medium 937581572
4 Small NA
# aggregate
aggregate(volume ~ size, data=example, FUN=sum)
Out:
size volume
1 Extra Large NA
2 Large NA
3 Medium 937581572
4 Small NA
colSums
를 통해 값에 액세스를 시도, 작동하는 것 같다 :
# Colsums
small <- example %>% filter(size == "Small")
colSums(small["volume"], na.rm = FALSE, dims = 1)
Out:
volume
3869267348
누구든지 문제가 무엇인지 상상할 수 있습니까?
글쎄, 나는 경고 메시지를 믿는다. 정보는 유익하다 :'[...] 정수 오버플로 - 합계 사용 (as.numeric (.))' – Henrik