2014-07-05 6 views
0

단일 복사본 영역에서 4 개의 유전자형에 대한 관찰 수의 샘플이 있습니다. 내가하고 싶은 것은이 유전형의 대립 유전자 빈도를 계산하고,이 주파수의 테스트는 R에서 카이 제곱을 사용하여 25 % : 25 % : 25 %의 예상 값에서 크게 벗어납니다.R의 표준 카이 제곱 검정?

지금까지 내가 가지고 :

> a <- c(do.call(rbind, strsplit(as.character(gdr18[1,9]), ",")), as.character(gdr18[1,8])) 
> a 
[1] "27" "30" "19" "52" 

다음 내가 할 총 수 :

> sum <- as.numeric(a[1]) + as.numeric(a[2]) + as.numeric(a[3]) + as.numeric(a[4]) 
> sum 
[1] 128 

지금 어떤 주파수 :

> af1 <- as.numeric(a[1])/sum 
> af2 <- as.numeric(a[2])/sum 
> af3 <- as.numeric(a[3])/sum 
> af4 <- as.numeric(a[4])/sum 
> af1 
[1] 0.2109375 
> af2 
[1] 0.234375 
> af3 
[1] 0.1484375 
> af4 
[1] 0.40625 

나는 지금 길을 잃다. Af1, af2, af3 및 af4가 0.25, 0.25, 0.25 및 0.25에서 크게 벗어나는 지 알고 싶습니다.

R에서 어떻게 수행합니까?

는 아드리안에게 감사

편집 :

좋아 제안, 내가 chisq.test() 노력하고 있어요 :

> p <- c(0.25,0.25,0.25,0.25) 
> chisq.test(af, p=p) 

     Chi-squared test for given probabilities 

data: af 
X-squared = 0.146, df = 3, p-value = 0.9858 

Warning message: 
In chisq.test(af, p = p) : Chi-squared approximation may be incorrect 

은 무엇 경고 메시지가 말해하려고? 근사값이 왜 잘못 되었습니까?

이 방법을 테스트하기 위해, 내가 예상 0.25에서 멀리 값을 집어 :

> af=c(0.001,0.200,1.0,0.5) 
> chisq.test(af, p=p) 

     Chi-squared test for given probabilities 

data: af 
X-squared = 1.3325, df = 3, p-value = 0.7214 

Warning message: 
In chisq.test(af, p = p) : Chi-squared approximation may be incorrect 

을 H0은 여전히 ​​거부되지 않습니다이 경우, 값이 꽤 멀리 떨어져 예상 0.25 값에서지라도. 이것보다 극단적 같은 주파수 이상의 우연히 시간 (p는 = 0.0003172)의 약 0.03 % 단독이 발생한다고 나타내는

+0

chisq.test은 (as.numeric은 (a)) –

+0

I 원래 게시물이 방법을 사용하여 약간의 실험을했다. 이 방법이 경고를주는 것 같습니다. –

답변

1
observed <- c(27,30,19,52) 
chisq.test(observed) 

.

귀무 가설이 네 가지 범주에 걸쳐 25 : 25 : 25 : 25 분포가 아니지만이 데이터가 3 : 3 : 1 : 9 기대치보다 크게 벗어 났는지 여부를 질문하는 경우, 명시 예상 주파수 :

expected <- sum(observed)*c(3,3,1,9)/16 

chisq.test(observed,p=c(3,3,1,9),rescale.p=TRUE) 
+0

답변 해 주셔서 감사합니다. 이 테스트에서 귀무 가설은 관측 된 값이 예상과 크게 다르지 않다는 것입니다. 0.0003의 p는이 가설을 거부합니다. 나는 당신의 3, 3, 1, 9 기대에 혼란스러워합니다, 당신은 어떻게 그 기대에 도달 했습니까? 관측 값의 실제 비율? 우리가 왜 이러는거야? –

+0

그런 경우에해야 할 일의 예일뿐입니다. –

+0

왜 우리는 3 : 3 : 1 : 9의 기대치를 테스트하고 있는지 이해할 수 없습니다. 왜 구체적으로 3 : 3 : 1 : 9입니까? –

관련 문제