나는 predict()가 완전한 경우에만 예측을 생성한다는 것을 알아 챘습니다. 나는 다음과 같은 전처리 옵션에 medianImpute
을 포함했다 :사전 처리 전제 R 캐럿 및 예측
train(outcome ~ .,
data = df,
method = "rf",
tuneLength = 5,
preProcess = c("YeoJohnson", "center", "scale", "medianImpute"),
metric = 'ROC',
trControl = train_ctrl)
}
이 나는 세트를 훈련하기 전에 누락 된 값에 전가을 일을해야한다는 것을 의미합니까? 그렇지 않은 경우 테스트 세트의 모든 사례에 대한 예측을 만들 수 없습니다. 나는 Kuhn 박사의 책에서 교차 검증 과정에서 사전 처리가 이루어져야한다고 읽었습니다 ... 감사합니다!
감사합니다. Lyzander. 그것은 medianImpute를 사용할 때 많은 의미가 있습니다. – user2300643
변환에도 적용됩니까? – user2300643
변환에 따라 다릅니다. 변환이 예를 들어 평균 및 분산을 기반으로하는 경우 예. – LyzandeR