2012-05-16 2 views
0

a) R의 colbycol 패키지에서 cbc.read.table 함수를 사용하여 비교적 큰 .txt 파일을 읽으려고합니다. 이 패키지를 읽고있는 내용에 따르면 대용량 파일 (R로 읽을 수있는 GB 이상)이 있고 분석을 위해 모든 열/변수가 필요하지 않을 때 작업이 더 쉬워집니다. 또한, 나는 cbc.read.table 함수가 동일한 read.table 매개 변수를 지원할 수 있다고 읽었습니다. 나는 다음과 같은 오류가 (R 내 파일의 미리보기를 얻기 위해) 매개 변수 nrows를 통과 할 경우, :파일을 읽는 중 필터를 사용하여 R +에서 cbc.read.table 함수를 사용하여 파일을 읽으려고 할 때

#My line code. I'm just reading columns 5,6,7,8 out of 27 
i.can <- cbc.read.table("xxx.txt", header = T, sep = "\t",just.read=5:8, nrows=20) 
#error message 
Error in read.table(file, nrows = 50, sep = sep, header = header, ...) : 
formal argument "nrows" matched by multiple actual arguments 

그래서, 내 질문은 : 당신은 내가이 문제를 해결하는 방법을 말해 줄 수 ?

i.can.b <- cbc.read.table("xxx.txt", header = T, sep = "\t",just.read=4:8) #done perfectly 
my.df <- as.data.frame(i.can.b) #getting error in this line 
Error in readSingleKey(con, map, key) : unable to obtain value for key 'Company' #Company is a string column in my data set 

그래서, 내 질문에 다시이다 : 나는이 문제를 해결하려면 어떻게

B) 그 후, 나는 다음과 같은 코드를 사용하여 모든 인스턴스를 읽으려고?

c) 파일을 읽는 동안 (인스턴스 조건에 따라) 필터링 할 수있는 방법을 알고 계십니까?

답변

1

미리보기를 원하면 read.table을 nrow = 20으로 설정하고 colClasses 인수를 설정하여 열을 읽을 수 있습니다.

관련 문제