R 및 임의의 포리스트 패키지를 범주 형 및 숫자 형 변수와 "원치 않는 coloumns"가 포함 된 데이터 집합으로 사용하려고합니다. 내 예측 변수로 포함시키지 않으려는 coloumns). 또한, 내 바람직한 변수 중 일부 (예측 변수로 사용되기로되어 있음)가 누락되었습니다. 어떻게 처리 할 수 있습니까?누락 된 값이 포함 된 범주 형, 숫자 형 및 "원하지 않는"변수가 섞여있는 임의 포리스트
1
A
답변
0
귀하의 데이터 세트가 이와 유사하다고 가정했습니다.
mydf <- data.frame(target = c(1:100),
param1 = c(rep("a",10), rep("b", 50),
rep("c", 20), rep("a",15), rep(NA, 5)),
param2 = runif(100,0,1),
param3 = c(runif(20,1,10),runif(50,20,30),rep(NA,10),
runif(10,0,5), runif(10,70,80)))
는 원하는 열을 사용합니다.
a. 수식에서 임의의 포리스트에서 사용할 열을 지정할 수 있습니다.
myrf <- randomForest(target ~ param1 + param2, mydf) # this excludes param3
b. 또는 원하는 열만 유지하여 데이터 집합의 하위 집합을 만들 수 있습니다. NA를 처리 할
mydf2 <- mydf[,c(target,param1,param2] myrf <- randomForest(target ~ ., mydf2)
는 값.
a. 당신은 그들을 대신 할 수도 있습니다.
b. 또는
rpart
과 같이 그들을 처리 할 수있는 다른 라이브러리를 사용할 수도 있습니다.
마지막으로이 스레드를 살펴 보시기 바랍니다.
관련 문제
- 1. 누락 된 범주 형 데이터 파이썬에 대한 거래
- 2. 범주 형 및 숫자 형 출력 모두를 예측하는 모델
- 3. rpart를 사용하여 범주 형 변수가 포함 된 건물 분류 트리
- 4. PySpark의 범주 형 입력에 대한 무작위 포리스트 회귀
- 5. 숫자 데이터를 범주 형 데이터로 변경 - 팬더
- 6. 숫자 변수를 범주 형 변수로 변경 하시겠습니까?
- 7. weka의 여러 수준의 범주 형 변수
- 8. Neural Nets 혼합 실수 형 및 범주 형 입력 기능
- 9. 부스트 :: 임의 및 열거 형
- 10. API에서 누락 된 범주
- 11. 범주 형 기능에 대한 Tensorflow 포함
- 12. Keras의 범주 형 변수에 대한 포함 문제
- 13. R에서 임의 샘플링 후 누락 된 값 포함 (합병 벡터 및 누락 된 값을 0으로 포함)
- 14. 범주 형 변수가있는 biglm
- 15. 파이썬의 다른 범주 형 변수와 비교하여 범주 형 변수를 플롯
- 16. 범주 형 상관 관계
- 17. 추가로 범주 형 변수
- 18. Dataframe은 (범주 형 변수)
- 19. 기초가있는 범주 형 산점도
- 20. 범주 형 인코딩 전후의 표준화?
- 21. Ruby에서 StatSample을 사용하여 chisq로 범주 형 및 숫자 형 변수의 여러 교차 탭 만들기
- 22. 형 교차 임의
- 23. k에서 k를 찾는 방법은 범주 형 데이터와 숫자 형 데이터가 혼합되어있을 때를 의미합니까?
- 24. 파이썬/Scikitlearn의 범주 형 변수
- 25. 범주 형 변수/요소 코딩
- 26. 범주 형 열의 범주 값 행 만들기
- 27. 조언이 포함 된 대화 형 함수 재정의
- 28. "observe"가 포함 된 대화 형 메뉴
- 29. jquery가 포함 된 반응 형 슬라이더
- 30. 동적 범위가 포함 된 분산 형 그래프
위대한! 고맙습니다 –