2017-04-04 5 views
0

캐럿 패키지의 rfe 접근 방식에 따라 임의 포레스트 모델의 기능을 선택하고 싶습니다. 내 데이터 세트에는 약 100 개의 레이블이있는 샘플이 포함되어 있으며 (실제 생활의 균형을 반영하는) 불균형이 심하기 때문에 계층화 된 교차 유효성 검사가 필요합니다. 그러나 층화 된 교차 유효성 검사와 관련된 rfeControl 함수에 대한 문서를 찾지 못했습니다. 나는 당신의 주름을 만들 createFolds()를 사용한다 method ="cv", rfe()캐럿의 rfeControl 기능이 계층화 된 폴드를 생성합니까?

ctrl <- rfeControl(functions = rfFuncs, 
       method = "cv", 
       verbose = FALSE) 

답변

1

를 사용하는 경우 rfeControl 기능을 계층화 주름을 만들 수없는 경우

은 아무도 알고 있나요,이는 출력 변수에 따라 균형됩니다. 자세한 내용은 ?createFolds을 참조하십시오.

+0

고마워요! createFolds 노트 ** ** createFolds 및 createMultiFolds의 경우 그룹 수는 표본 크기와 k에 따라 동적으로 으로 설정됩니다. 더 작은 샘플 크기의 경우이 두 함수는 계층화 된 분할을 수행하지 않을 수 있으며, 대부분 데이터를 4 분위수로 나눌 수 있습니다. ** 그래서이 동적 조정이 언제 어떻게 어떻게 수행되는지는 확실치 않지만'method = " cv "'그리고 결과를보십시오. –

+1

예, 귀하의 데이터에 따라 다릅니다. 또한'rfeControl'에서'index' 인자를 사용하여 자신의 인덱스를 전달할 수 있습니다 (아마도'createFolds'로 생성되었습니다). –