큰 (약 10GB) xdf (revolution R 포맷) 파일에서 임의의 포리스트를 실행할 수 있습니까? 분명히 rxReadXdf를 시도해보고 데이터 프레임으로 변환 할 수는 있지만 ... 내 컴퓨터에는 8GB RAM 만 있으며 앞으로 더 큰 데이터 세트를 처리 할 수도 있습니다.큰 xdf 파일의 무작위 포리스트에서 데이터 프레임을 읽지 않고
#'train.xdf" is a 10gb training data set
rf<- foreach(ntree=rep(250, 4), .combine=combine,
.packages='randomForest') %do%
randomForest(amount2~.,data="train", ntree=ntree, importance=TRUE,
na.action=na.omit, replace=FALSE)
을하지만 랜덤 포레스트는 "기차"(AN XDF) 파일에 걸릴 수 없습니다 예를 들어, foreach 루프를 사용하여 내 쿼드 코어 시스템에 1000 그루의 나무를 실행하고자합니다. 데이터 프레임을 읽지 않고 xdf에서 임의의 포리스트를 직접 실행할 수 있습니까?
건배
agsub
그것이 가능하다고 생각하지 않지만 xdf 파일을 사용한 적이 없습니다. 대신 데이터를 작은 덩어리로 분할하고 임의의 포리스트를 훈련시키고 모든 덩어리의 최상의 기능을 결합한 최종 모델을 작성하려고합니다. 그것은 꽤 성가시다. – Backlin
예. 아마 내가 지금 갈 방법입니다. – thiakx
데이터 분석이 쉽다면 좋은면이 있습니다. – Backlin