2013-10-17 3 views
0

큰 테이블 (약 500000 x 1000)을 R에서 읽으려고합니다.정수의 큰 행렬을 읽는 것

read.table 작동하지만 끔찍하게 느립니다.

scan도 속도가 좋지만 정상적인 data.frame 또는 매트릭스로 형식을 변경할 수 없었습니다.

테이블의 행 수를 미리 알지 못합니다. (열 수는 template_line <- read.table(nrow=1,file=my_file)입니다.) R 2.15와 호환되어야합니다. - fread 인 것 같습니다. data.frame 또는 매트릭스 (빠른)에

my_matrix <- scan(file=my_file,what=template_line); 

: 어떻게 출력을 변환합니까 :

그래서 질문 중 하나입니까?

또는 크기를 모른다면 R으로 빨리 정수 테이블을 읽는 방법은 무엇입니까?

+1

'fread'가 출력되면'sqldf'는 어떻게됩니까? 또한,'scan'의 결과물에 어떤 문제가 있습니까? – A5C1D2H2I1M1N2O1R2T1

+0

@AnandaMahto'my_matrix [1,2]'에 접근 할 수 있어야하고, 위의 코드를 준다고해서 작동하지 않습니다. –

+1

어? 왜 'fread'가 나오지? 현재 CRAN'data.table'은'1.8.10'입니다. **'Depends : R (≥ 2.12.0)'** –

답변

0

어떨까요?

num_cols <- 5 
my_matrix <- matrix(scan(file=my_file, what=template_line), ncol=num_cols, byrow=TRUE)