2 가지 조건에서 200 개의 유전자에 대한 발현 값 (log2)을 가지며, 각 조건에 대해 20 복제본을 갖는다. 각 유전자의 각 조건 사이의 상관 관계를 계산하고 가장 높은 순위부터 가장 낮은 순위까지 순위를 매기고 싶습니다.2 개의 샘플과 복제물의 상관 관계
이것은 생물 통계 문제의 문제이지만, 아직도 많은 사람들이이 문제에 직면 해있는 생물 학자/바이오 프로그래머에게 중요한 문제라고 생각합니다.
데이터 집합은 다음과 같습니다 : 나는 샘플 데이터의 각 샘플에 대한 두 개의 복제를 보여 주었다
Gene UT1 UT2 T1 T2
DDR1 8.111795978 7.7606511867 7.9362235824 7.5974674936
RFC2 10.2418824097 9.7752152714 10.0085488406 9.5723427524
HSPA6 6.5850239731 6.7916563534 6.6883401632 7.3659252344
PAX8 9.2965160827 9.2031177653 9.249816924 8.667772504
GUCA1A 5.4828021059 5.3797749957 5.4312885508 5.1297319374
.
R 또는 python으로 해결책을 찾고 있습니다. R의 cor 기능은 내가 원하는 것을 제공하지 않습니다.
당신이 원하는 것이 무엇이고 R의 'cor' 기능이 그것을하지 않는 이유를 더 자세히 설명해 주시겠습니까? 예를 들어,이게 이거 야? (1) 각 유전자에 대해 두 개의 길이 - 20 벡터 벡터가 있는데, 하나는 치료되지 않은 상태이고 다른 하나는 치료 된 상태입니다. (2) 두 벡터 사이의 상관 계수를 계산하려고합니다. (3) 그런 다음 상관 계수의 값에 따라 유전자를 분류하고 싶습니다. –
그런 경우라면 문제의 어느 부분에서 문제가 발생합니까? 상관 관계가있는 특정 데이터 비트 추출? 상관 번호 계산? 정렬하고 있니? –
문제가있는 t- 테스트 – Angelo