2016-06-27 5 views
-1

메모리 사용량이 많은 문제에 대한 게시물이 있음을 알고 있지만 여전히 내 사례를 도울 수있는 것이 있는지 확인하려고합니다.효율적인/다중 스레드 실행 회귀 예측

내가 (변수 행렬 X에 의해 응답 Y)는 ~ 600 60,000에 의해 임의의 숲 모델을 피팅하고있어 매트릭스 :

library(randomForest) 
fit <- randomForest(x=X,y=y) 
그때 임의의 적합에 그 적합을 비교하려는

그 무엇 내가하고 있어요입니다 :

library(parallel) 
set.seed(1) 
random.list <- mclapply(1:1000,function(f){ 
    idx <- shuffle(nrow(X)) 
    random.y <- predict(object=fit,newdata=X[idx,],type="response") 
}, mc.cores = ncores) 

불행하게도이 너무 비현실적하게 집중적 인 메모리 (100기가바이트 이상 필요)입니다.

내가 현재 실행중인 환경은 Linux입니다.

제안 사항?

답변

0

mclapply2 {snpEnrichment}처럼 보이는 것이 합리적입니다.

관련 문제