많은 매개 변수 조합 (20-40k)을 통해 합리적으로 크기가 조정 된 데이터 세트 (10-20MB)를 시뮬레이트합니다. 각 데이터 집합 x 매개 변수 집합은 mclapply
을 통해 푸시되고 결과는 list
이며 각 항목에는 출력 데이터 (목록 항목 1)와 해당 결과를 목록 항목 2 (해당 목록의 각 요소가 매개 변수)로 사용하는 매개 변수가 들어 있습니다.R로 생성 된 큰 결과를 저장하기위한 이상적인 형식은 무엇입니까?
방금 81K 목록을 통과했지만 (30K 청크에서 실행해야 함) 결과 목록은 각각 약 700MB입니다. 파일을 .rdata
개의 파일로 저장했지만 .Rda
에 다시 저장합니다. 그러나 각 파일은 영원히 읽을 때 R
에 저장됩니다. 특히 장기간 보관할 때 가장 좋은 방법이 있습니까?
mclapply
은 벡터를 직렬화 할 수 없다는 오류를 던지고이 큰 작업은 클러스터에서 영원히 걸릴 것입니다 (3 방향으로 분할, 3 시간/작업 소요). 그러나 여러 결과 파일을 가지고 results1a.rdata
, results2b.rdata
, results3c.rdata
도 비효율적 인 것 같습니다.
또 다른 옵션은 다른 이름으로 개체를 복원 할 수있는'saveRDS'입니다. – mnel