2013-07-05 2 views
0

처음으로 통계 소프트웨어를 사용하고 있는데 R과 어려움을 겪고 있습니다. 데이터를 수집하여 csv로 변환했습니다 (이유는 ";"대신 ";"로 구분)하고 가져 왔습니다 R에 들어가면 잘 작동합니다. str 함수를 사용하여 요약을 살펴보면 int 변수뿐만 아니라 인수 변수도 있지만 변경 방법을 알기는 어렵지 않습니다. 이전에 Excel에서 모든 열의 형식을 지정했기 때문에 수치를 말합니다. 나는 논문을 위해 여러 회귀를 시도하고 있지만 데이터를 올바르게 업로드 할 수 없기 때문에 어떤 도움을 주셔서 감사하겠습니다.데이터로드 중 R

또한 R에 포함 할 수있는 설명 변수의 수를 아는 사람이 있습니까?

미리 감사드립니다.

+1

Luisa에 오신 것을 환영합니다. 다음 번에 더 나은 질문을하기 위해 [this] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)을 읽으십시오. – agstudy

+0

Excel이 데이터를 변환 한 형식을 유지하려면'read.csv ("myData.csv", stringsAsFactors = FALSE)'를 사용할 수 있습니다. 숫자 형식의 모든 것을 포맷하는 이유는 무엇입니까?하지만 Excel은 여전히 ​​문자로 저장되므로 csv 파일의 데이터를 살펴 봐야합니다. – vaettchen

+0

누락 된 관측치가 예를 들어 '.' Excel 데이터 파일에서 na.strings = "." read.csv 문에서. –

답변

5

as.numeric과 같이 값을 숫자로 변환하는 많은 옵션이 있지만 colClasses 옵션을 read.csv에 사용하는 것이 좋습니다. 이렇게하면 올바른 형식으로 데이터를 읽을 수 있습니다. 예를 들어

: 당신은 5 개 이상의 변수가 있고 요소로 문자열을 변환하지 않으려면

read.csv(filename, sep=';', 
        colClasses=c("character",  ## first column is a character 
            rep("numeric",4)) ## followed by 4 numeric varaibles. 

또한이의 conjonction에 인수 stringsAsFactors=FALSE를 사용할 수 있습니다.

자세한 설명은 ??read.csv에서 발견 또는 더 일반적으로 ??read.table

에 대한 당신 모호한 질문은 "내가 R에 얼마나 많은 설명 변수를 포함 할 수 있습니다?"할 수있다 , 나는 그것을 얼마나 많은 컬럼/변수를 읽을 수 있는지 공식화했다. matrix/data.frame을 읽거나 작성하는 유일한 한계는 RAM입니다.

0

read.csv하면하는 요소 또는 문자열로 당신의 가정 숫자 변수의 일부를 가져 오는, 당신이 NULL, NA 또는 다른 숫자가 아닌 값을있는 그 열의 일부 값이 매우 높습니다. 숫자가 아닌 항목의 레벨이나 값을 확인하고 Excel이나 R 자체에서 제거/처리하십시오. 일들이 순수한 숫자이면 벌금으로 읽어야하며, 아니면 as.integer() 또는 as.numeric()으로 후 처리 할 수 ​​있습니다.

+0

감사합니다. 내 데이터에는 적정량의 인형이 있습니다. R에서 어떻게 든 인정해야합니다. 인형은 순간에 "int"로 나타나지만 "소득"과 같이 순전히 숫자 인 다른 요소가 요인으로 표시됩니다 ... 나는 숫자로 시도 할 것입니다. 숫자입니다. – Luisa

+0

Luisa 얼마나 많은 변수가 있습니까? 왜 명시 적으로 colClasses를 정의하지 않습니까? – agstudy

+0

42 가지 변수가 있습니다. (저는 많이 알고 있지만 교수는 효과가있을 것이라고 확신했습니다). 나는 그것을 들어 본 적이없는 colClasses를 읽어야한다. – Luisa

관련 문제