a) R의 colbycol
패키지에서 cbc.read.table
함수를 사용하여 비교적 큰 .txt 파일을 읽으려고합니다. 이 패키지를 읽고있는 내용에 따르면 대용량 파일 (R로 읽을 수있는 GB 이상)이 있고 분석을 위해 모든 열/변수가 필요하지 않을 때 작업이 더 쉬워집니다. 또한, 나는 cbc.read.table
함수가 동일한 read.table
매개 변수를 지원할 수 있다고 읽었습니다. 나는 다음과 같은 오류가 (R 내 파일의 미리보기를 얻기 위해) 매개 변수 nrows
를 통과 할 경우, :파일을 읽는 중 필터를 사용하여 R +에서 cbc.read.table 함수를 사용하여 파일을 읽으려고 할 때
#My line code. I'm just reading columns 5,6,7,8 out of 27
i.can <- cbc.read.table("xxx.txt", header = T, sep = "\t",just.read=5:8, nrows=20)
#error message
Error in read.table(file, nrows = 50, sep = sep, header = header, ...) :
formal argument "nrows" matched by multiple actual arguments
그래서, 내 질문은 : 당신은 내가이 문제를 해결하는 방법을 말해 줄 수 ?
i.can.b <- cbc.read.table("xxx.txt", header = T, sep = "\t",just.read=4:8) #done perfectly
my.df <- as.data.frame(i.can.b) #getting error in this line
Error in readSingleKey(con, map, key) : unable to obtain value for key 'Company' #Company is a string column in my data set
그래서, 내 질문에 다시이다 : 나는이 문제를 해결하려면 어떻게
B) 그 후, 나는 다음과 같은 코드를 사용하여 모든 인스턴스를 읽으려고?
c) 파일을 읽는 동안 (인스턴스 조건에 따라) 필터링 할 수있는 방법을 알고 계십니까?