-1
메모리 사용량이 많은 문제에 대한 게시물이 있음을 알고 있지만 여전히 내 사례를 도울 수있는 것이 있는지 확인하려고합니다.효율적인/다중 스레드 실행 회귀 예측
내가 (변수 행렬 X에 의해 응답 Y)는 ~ 600 60,000에 의해 임의의 숲 모델을 피팅하고있어 매트릭스 :
library(randomForest)
fit <- randomForest(x=X,y=y)
그때 임의의 적합에 그 적합을 비교하려는
그 무엇 내가하고 있어요입니다 :
library(parallel)
set.seed(1)
random.list <- mclapply(1:1000,function(f){
idx <- shuffle(nrow(X))
random.y <- predict(object=fit,newdata=X[idx,],type="response")
}, mc.cores = ncores)
불행하게도이 너무 비현실적하게 집중적 인 메모리 (100기가바이트 이상 필요)입니다.
내가 현재 실행중인 환경은 Linux입니다.
제안 사항?