그래서 ... 많은 범주가있는 변수를 가진 큰 데이터 집합이 있습니다. 그 범주 중 일부를 하나로 묶는 새로운 변수를 만들고 싶습니다.많은 범주의 더미 변수 생성
조건문을 사용하면 그럴 수 있지만 카테고리의 양을 고려할 때 그 때 한 줄로 이동하는 데 영원히 걸릴 것입니다. 또한 원래 변수는 숫자이지만 값 자체는 무작위이므로 논리적 또는 범위 문을 사용할 수 없습니다.
많은 특정 값을 기반으로 조건부 변수를 만드는 방법은 무엇입니까?
나는 다음을 시도했지만 성공하지는 못했다. 다음은 하나의 그룹으로 분류하려는 여러 카테고리의 예입니다.
classes <- c(549,162,210,222,44,96,62,208,525,202,149,442,427,
564,423,106,422,546,205,560,127,536,34,261,568,
366,524,401,548,95,156,8,528, 430,527,556,203,554,523,
501,530,55,252,585,19,540,71,204,502,504, 196,436,48,
102,526,201,521,23,558,552,118,416,117,216,510,494,
516,544,518)
이렇게 나에게는 꽤 직관적 이었지만 작동하지 않습니다.
df$chem<- cbind(ifelse(df$class == classes ,1,0))
도없이 미안에게 초보자 대답, 이것은 아마 할 열심히 아니지만, I've이 특정 문제에 대한 해결책을 찾고 나는 그것을 찾을 수가 할수 없어. 내가 뭘 놓치고 있니? 감사!
의 중복 가능성 http://stackoverflow.com/questions/9406289/automatic-dummy-variables- in-r) – mnel
더미 변수를 만드는 것이 좋은 질문입니다. 많은 일을 위해 그것은 당신을 위해 그들을 만들 것입니다. – Dason
OP가 찾고있는 'cut'이 아닌가요? –