나는 죄송합니다. 그것들은 게놈의 특정 위치와 2 개의 다른 환경에서 그 위치에서 각 DNA 염기가 관찰되는 횟수를 나타냅니다. 예시 비상 표 데이터는 양의 정수가 될 수통계
A C G T
condition1 0 2 20 70000
condition2 3 15 0 95000
or
A C G T
condition1 80146 0 5 0
condition2 26821 2 4 0
것이다. 최소 카운트는 0이고 최대 값은 ~ 800,000까지 올라갈 수 있습니다. 하나의 카운트는 일반적으로 거의 모든 행과 열의 총 카운트입니다 (예 : 위의 첫 번째 사례의 셀 T와 두 번째 사례의 셀 A와 같은 두 조건 모두에서 동일 함). 그런 다음 1 또는 2 개의 다른 셀은 낮은 값을 갖습니다 셀 수는 ... 차이가있는 경우 다른 셀에서 관찰되어야합니다.
목표는 추가 분석을 위해이 두 가지 환경 조건간에 크게 다른 위치를 식별하는 것입니다. 우리의 측정 방법은 10^-6의 오차율로 추정됩니다.
이 데이터를 분석하려면 R을 사용하고 있습니다. 작은 또는 0 카운트의 셀을 가지고 있기 때문에 이것에 대한 카이 제곱 테스트를 실행할 수 있는지 확신 할 수 없습니다.
이with a workspace of 1E5
FEXACT error 40.
Out of workspace.
with a workspace of >3E5
FEXACT error 501.
The hash table key cannot be computed because the largest key
is larger than the largest representable int.
The algorithm cannot proceed.
Reduce the workspace size or use another algorithm.
사람이 적절한 시험을 제안하거나, 어부 또는 카이 제곱 설정을 할 수 : 피셔의 테스트와 나는이 오류를 얻을? 사전에
많은 감사,
론
이
질문을 명확하게하려면 열에 이름을 부여하고 각 열에 어떤 값이 올 수 있는지 알려주고 2 개의 예제 표를 제공하십시오. 이렇게하면 포럼 회원들이 귀하를 도울 수 있습니다. – rnso
그냥 했어요. 희망이 지금 더 의미가 있습니다. – Ron
"1 또는 2 개의 다른 셀은 낮은 카운트를 가질 것입니다. 차이가 있다면 관찰해야하는 다른 셀에 있습니다.": 낮은 것을 의미하는 것 : 100을 컷오프로 사용합니까? – rnso