2013-10-14 5 views
-1

누락 된 값이있는 txt 파일에서 r로 데이터를 올바르게 가져 오는 데 문제가 있습니다. 가져올 때 누락 된 값이있는 숫자 값 열 (".""Na")을 계수 변수로 읽습니다. 내가 사용 가져 오기 코드는 다음과 같습니다 값이 누락 된 txt 파일에서 r로 데이터를 가져 오는 중

dat2 <- read.table(file.choose(), header = T) 

데이터의 구조를 보면, 내가 관심있는 열에 대한 참조 :

adultreg : Factor w/ 19 levels "1.85","101.75",..: 11 15 15 1 13 6 17 9 16 3 

숫자 변수 (dat2$adultreg<-as.numeric(dat2$adultreg)에 요소를 변환 한 후, 나는 연구를 물어 데이터를 출력하여 그 내용을 볼 수 있으므로 더 이상 텍스트 파일의 데이터가 아닙니다.

+2

당신은'read.table 사용해야입니다 (...'stringsAsFactors = FALSE ')입니다. 덕분에 – agstudy

답변

1

R의 요인은 실제로 까다 롭습니다. 실제로는 정수로 저장되며, 각 정수는 levels에 따라 디코딩됩니다. 변환

가장 직관적 인 방법은 as.numeric(as.character(dat2$adultreg))

가장 빠른 방법 (내가 믿는) levels(dat2$adultreg)[dat2$adultreg]

+0

. 감사합니다. 도움이됩니다. 하지만 지금은 누락 된 값을 포함하는 변수와 선형 모델을 만들려고하면 개체에 누락 된 값이 있다는 오류가 발생합니다. 어떻게 이런 일이 일어나지 않도록 원본 데이터에 이것을 표시해야합니까? 또는 이것을 적절하게 처리하는 가져 오기 명령에 있습니까? – user2880353

+1

@ user2880353이 댓글은 원래 질문과 관련이 없습니다. 동일한 OP에서 많은 질문을하는 것을 피하십시오. 즉, 누락 값만 제거하면됩니다. – agstudy

관련 문제