저는 SVMight 스파 스 매트릭스가 ~ 700,000 x ~ 800,000 인 H2O를 사용하고 있습니다. 파일 크기는 디스크에서 약 800MB입니다. 하지만 H2O로 가져 오면 300GB 이상의 RAM이 필요합니까? 과정은 또한 끝내기에는 너무 오래 걸립니다 (~ 15 분).H2O가 희소 행렬로 너무 많은 RAM을 사용합니다.
비교에서 매트릭스 패키지를 사용하여 RAM에 스파 스 매트릭스를 만들고 저장할 수 있습니다. 이 경우 스파 스 매트릭스는 ~ 1.2GB의 RAM을 필요로합니다. 정말 H2O를 즐길이 프로젝트를 위해 그것을 사용하고 싶습니다 때문에
openjdk version "1.8.0_121"
OpenJDK Runtime Environment (build 1.8.0_121-b13)
OpenJDK 64-Bit Server VM (build 25.121-b13, mixed mode)
Starting H2O JVM and connecting: .. Connection successful!
R is connected to the H2O cluster:
H2O cluster uptime: 2 seconds 76 milliseconds
H2O cluster version: 3.14.0.3
H2O cluster version age: 1 month and 8 days
H2O cluster name: H2O_started_from_R_ra2816_fhv677
H2O cluster total nodes: 1
H2O cluster total memory: 455.11 GB
H2O cluster total cores: 24
H2O cluster allowed cores: 24
H2O cluster healthy: TRUE
H2O Connection ip: localhost
H2O Connection port: 54321
H2O Connection proxy: NA
H2O Internal Security: FALSE
H2O API Extensions: XGBoost, Algos, AutoML, Core V3, Core V4
R Version: R version 3.4.1 (2017-06-30)
내가 어떤 조언을 부탁드립니다 :
library(h2o)
h2o.init(nthreads=-1,max_mem_size = "512g")
x <- h2o.importFile('test2.svmlight', parse = TRUE)
가 여기 내 시스템입니다 :
다음은 내 코드입니다.