2012-11-25 3 views
0

포함될 문자열이 I는 아래와 같다 데이터 집합을 가지고수입 데이터 세트는 일부 열은 공간

ID   Message  
    1    . 
    2    . 
    3  Click_screen 
    4  Blank screen 
    5    . 
    6    . 
    7    . 

실제 데이터 셋이 48 열 및 50,000 개의 행을 갖는다.

read.table()으로이 데이터 세트를 가져 오는 것은 두 개의 하위 문자열 사이에 공백이있는 "빈 화면"문자열 때문에 문제가됩니다. R에서이 문제를 회피하기보다는 Excel에서 원본 데이터 셋을 변경할 수있는 방법이 있는지 궁금

Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : 
    line 4 did not have 48 elements 

예를 들어, 내가 좋아하는 오류 메시지를 받았습니다.

편집 : 그냥 내가 참으로 채우기 설정하려고, 추가, 나는 아래의 오류 메시지가 도착하기 :

Error in read.table(file.choose(), header = T, fill = T) : 
    duplicate 'row.names' are not allowed 
+0

옵션 fill = TRUE로 읽으려고 했습니까? – agstudy

+0

다음과 같은 오류 메시지가 나타납니다. read.table (file.choose(), header = T, fill = T) 오류 : duplicate 'row.names'가 허용되지 않습니다. – Alex

+0

헤더없이 사용하려고 시도하면 hedaer = F – agstudy

답변

1

하면 시도 파일을 공백으로 구분하면 (탭 분할과 반대), 필드 너비의 벡터와 함께 read.fwf가 필요할 수 있습니다. 파일을 탭으로 구분하면 read.table (sep = '\ t', ...)을 원할 수 있습니다.

+0

sep = "\ t"agstudy의 fill = TRUE 제안과 함께이 트릭을 수행했습니다. 감사! – Alex

1

그것은 당신의 지역 구분에 따라 달라을하지만,이

read.table(fileName,fill=TRUE,header=FALSE,sep =';')