2017-11-26 6 views
0

Im는 생물 정보학 과정을 진행하고 있습니다.점수 매트릭스에서 숨겨진 마르코프 모델

위치 특정 확률 매트릭스 (PSPM)에서 숨겨진 Makrov 모델 (HMM)을 모델하는 방법을 알아 내려고합니다.

어떻게 모델링해야하는지 명확한 패턴이 있습니까? PSPM을 기반으로하는 3 개 이상의 주에서 모델을 만드는 방법을 보여줄 수 있습니까?

PSPM의 예를 제공 하겠지만 직접 사용해보십시오.

PSPM 예제는 MIT 과정에서 가져온 것입니다.

+0

당신이하고 싶은 것이 분명하지 않습니다. 배출 확률로 주어진 확률로 각 위치를 상태로 차갑게 모델링합니다. 그러나, 그러한 모델에서, 국가들 간의 전이 확률은 "1"이 될 것이다. 따라서 국가는 숨겨지지 않을 것입니다. 더 긴 시퀀스 내에서이 패턴/모티프의 발생을 확인 하시겠습니까? 그런 다음 "외부 모티브"에 대한 상태를 가져야하며 해당 상태에 대한 일부 방출 문제를 가정해야합니다. – cnettel

+0

@cnettel, 과제의 질문은 다음과 같습니다. TF A에 TFB 의 0 개, 하나 또는 여러 개를 포함 할 수있는 DNA 시퀀스를 모델링하는 HMM을 설계하십시오. 응답은 상태와 전환을 그래픽으로 표현해야합니다 HMM을 구성한다. " 나는 그것을 정상 마르코프 체인으로 모델링하는 방법을 알고 있지만 숨겨진 마르코프 모델이 아닙니다. – Abdiabdisson

답변

1

질문은 명확하지 않지만 어쩌면 도움이 될 것입니다.

이 모델의 경우 원칙적으로 원하는만큼의 위치를 ​​지정할 수 있습니다.

여기에 생물 정보학에서 할 possilbe 무엇의 예 therw입니다 :

것은 (우리가 "데이터베이스"를 호출 할 수 있습니다)의 당신은 DNA의 정렬을 상상해 보자. 당신은 hmmer와 같은 모델을 구축 할 수 있습니다 :

hmmbuild <hmm_profile> <alignment> 

는 그런 다음 정렬의 각 위치 또한 전이 확률에 대한 모든 전이 확률을 포함 할 hmmer_profile를 확인할 수 있습니다.

그런 다음 예를 들어 새로운 시퀀스를 검색 할 수 있습니다. 이제이 파일의 시퀀스 ("쿼리")의 세트가 상상 당신은 당신이 각 쿼리가 더 나은 정렬하는 배치 알 수 있도록, 당신의 "데이터베이스"에 대해 그들을 매핑 할 : 그것은을 반환

nhmmer -o <output_file> --dna <hmmer_profile> <sequences_file> 

output_file에 데이터베이스에 대해 정렬 된 시퀀스.

관련 문제