2014-03-25 6 views
2

저는 수많은 DNA 검사 중 하나를 온라인으로 찍었습니다. DNA를 기반으로 한 유전 적 친지를 찾아 냈습니다. 그러나이 친척의 대부분은 적어도 3 번째 사촌입니다. 이 다른 사용자는 온라인으로 가계도를 가지며 JSON 데이터로 액세스 할 수 있습니다.
나는 '땅의 진실'을 알지 못한다.먼 친척의 씨앗을 바탕으로 다른 가족의 나무에서 가장 가까운 친척을 유추하는 방법은 무엇입니까?

하지만이 데이터를 처리하기 위해 알고리즘이 필요합니다. 내가 생각할 수있는 가장 단순한 것은 데이터에서 가장 일반적인 성을 찾는 것이지만, 그렇게 정교하지는 않습니다. 관련 토론이나 알고리즘에 대한 제안이나 링크가 더 필요합니다.

나는 일 경우 토론을 원하지 않습니다. 나는 내 자신의 이익을 위해, 또는 학문적 인 운동에 더 관심이 있다면 100 % 확실하지 않습니다.

답변

1

최대 우도 추정은 이러한 종류의 문제에 대한 표준 접근 방법 중 하나입니다. 가계도를 결합하면 트리에있는 누군가가 테스트 결과를 얻을 가능성이 얼마나 높은지 계산합니다 (수학을 단순화하기 위해 자유로운 가정을 자유롭게 수행함). 그런 다음 모든 사람을 반복합니다. (너무 오래 걸리지 않기를 바랍니다.) k 개의 가장 큰 우도를보고하십시오.

여기 까다로운 부분은 합리적인 추정치를 얻는 것입니다. 여기 하나의 접근 방식이 있습니다. 나는 그것이 좋은 것인지 전혀 모른다. 귀하의 가족 "나무"는 각 노드가 정확히 0 또는 2 개의 전임자를 가진 지시 된 비순환 적 (abyclic) (아무리 잘도 타임 머신을 가지고 있지 않은) 그래프입니다. 토폴로지 (즉, 그럴듯한 시간 순서) 순서로 노드를 반복합니다. 전임자가 0 인 노드의 경우, k 쌍의 1- 비트 대립 유전자로 그룹화 된 2k 개의 무작위 비트로 구성된 "염색체"를 초기화하십시오 (k를 설정하는 방법은 확실하지 않거나, 아마도 천 명입니까?). 두 개의 전임자가있는 노드의 경우, k 쌍 각각에 대해 어머니의 대립 유전자 중 하나와 아버지의 대립 유전자 중 하나를 선택하여 염색체를 생성합니다. 결국 Hamming 거리를 통해 유전 적 유사성 점수를 얻을 수 있습니다. 아마도 제 3의 사촌의 화분에 놓인 예제에 대한 시뮬레이션/시뮬레이션을 통해 테스트 결과와 거리 사이의 매핑을 찾아야 할 것입니다.

+0

생물학적 용어를 망쳤다면 언제든지이 답변을 편집하십시오. 잠시 지났습니다 = P –

+0

당신의 접근 방식을 올바르게 이해한다면 다른 사용자의 DNA 기록에 접근 할 수 있다고 가정합니다. 하지만 나는 그렇지 않습니다. 나는 그들의 가계도에 접근 할 수 있습니다. –

+0

@coding_hero 아니요, 가계도에 따라 DNA 기록을 위조해서 접근 할 수 있다면 실제 DNA 기록이 얼마나 가까운지 알 수 있습니다. –

관련 문제