2014-04-12 3 views
0

일부 누락 된 값이있는 두 개의 요인 변수를 분석 중입니다. 어떻게 테이블 명령에서 누락 된 값을 생략 할 수 있습니다 :테이블 명령에 누락 된 값 처리하기

> table(code3,code4) 
     code4 
code3  HIGH LOW 
     134 9 1 
    HIGH 22 7 0 
    LOW 19 0 8 
> 
> 
> round(prop.table(table(code3,code4),2),2) 
     code4 
code3  HIGH LOW 
     0.77 0.56 0.11 
    HIGH 0.13 0.44 0.00 
    LOW 0.11 0.00 0.89 
> 

나는 테이블은 즉, 값 열과 행 "HIGH"와 "LOW"가 누락 된 모든 값을 생략 보여주고 싶어요.

> 
> chisq.test(code3,code4) 

     Pearson's Chi-squared test 

data: code3 and code4 
X-squared = 57.8434, df = 4, p-value = 8.231e-12 

Warning message: 
In chisq.test(code3, code4) : 
    Chi-squared approximation may be incorrect 
> 
> 

을 나는 그것이 간단한 문제가 의심하지만 난 인터넷에 어떤 쉽게 답을 찾을 수 없습니다 :이 누락 된 값은 어떤 차이가 chisq.test 할 수 있도록한다면

또한 말씀 해주십시오.

"도움 (테이블)"R의 명령은 다음과 부여합니다 정보 :

## NA counting: 
    is.na(d) <- 3:4 
    d. <- addNA(d) 
    d.[1:7] 
    table(d.) # ", exclude = NULL" is not needed 
    ## i.e., if you want to count the NA's of 'd', use 
    table(d, useNA="ifany") 

가 어떻게이 내 요구에 적응할 수 있을까? 당신의 도움을 주셔서 감사합니다.

+0

안녕하세요. 실제 예제를 제공하십시오. http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example – sgibb

답변

1

'누락 된 값'이 공백 ("")으로 의심됩니다. 대신 NA으로 코드를 작성하면 더 쉽게 사용할 수 있습니다.

작은 예를

# sample data with some 'missing values' 
x <- c("high", "", "low", "", "high", "") 
x 
table(x) 
# high low 
# 3 2 1  

# replace "" with R:s 'official' missing values 
x[x == ""] <- NA 

table(x) 
# x 
# high low 
# 2 1 

는 아마도 관련 (내가 벌어지고 어떻게 됐을까의) 여기뿐만 아니라 read.tablena.strings 인수입니다.

다음 번에는 최소 단위로 제공되는 을 제공하십시오. 이 링크에서 일반적인 아이디어와 R : here, herehere에서 수행하는 방법을 확인하십시오.

+0

답변 해 주셔서 감사합니다. 나는 'x [x == ""] <- NA'를 시도했는데 테이블은 여전히 ​​'0'값을 보여줍니다. na.strings = "NA"를 read.csv (파일 이름)에 추가 할 수 있습니까? 노력했지만 작동하지 않는 것 같습니다. – rnso

+1

'na.strings'에서 누락 된 값이 텍스트 파일에 코딩 된 값을 지정합니다.이 값은 데이터 프레임에서 'NA'로 변환됩니다. 도움말 텍스트'? read.table'에서 볼 수 있듯이 : "공백 필드는 논리적, 정수, 숫자 및 복합 필드에서 누락 값으로 간주됩니다." 변수가'read.table'에 의해 문자로 해석되면, 공백은 누락 된 것으로 간주되지 않지만 데이터 프레임에는' ""'으로 나타날 것입니다. 다시 말하지만, 좀 더 구체적인 도움을 얻으려면 ** 최소한의 재생산 가능한 예제 **를 제공해야합니다. – Henrik