연속 데이터를 기반으로하는 임의의 3 가지 범주로 새 변수를 생성하고 싶습니다.dplyr로 연속 변수를 분류하십시오.
set.seed(123)
df <- data.frame(a = rnorm(100))
내가
df$category[df$a < 0.5] <- "low"
df$category[df$a > 0.5 & df$a < 0.6] <- "middle"
df$category[df$a > 0.6] <- "high"
는 것 dplyr를베이스가 사용하여, 나는이에 대한 mutate()
, 솔루션을 것 같아요?
또한 범주를 선택하는 대신 범주를 계산하는 방법이 있습니까? 나는. 카테고리에 대한 휴식 시간을 계산해야합니다.
편집
대답이 thread에, 그러나, 그러므로 나는이 질문이 목적을 수행 생각 나를 혼동 (그리고 다른 사람을 혼동 할 수있다)하는 라벨을 포함하지 않습니다.
에 대한
quantiles
를 사용하여. ''cut'을 참조하십시오. – aichao답변은 여기에 있습니다. http://stackoverflow.com/questions/23163567/r-dplyr-categorize-numeric-variable-with-mutate – gfgm
@GabrielFGeislerMesevage 확실히, 나는 그것을 읽었습니다. Robert와 aichao는 아래에서 언급했다. 초보자를 위해서, 나 자신처럼, 나는이 스레드가 목적을 제공한다고 생각한다. 틀 렸으면 고쳐줘. – FilipW