각 프레임의 첫 번째 start_codon 만 찾는 방법. 아래 코드에서 모든 start_codon 위치를 제공합니다.fasta의 첫 번째 ORF 만 찾아서 인쇄하십시오.
DNA = "ACCACACACCATATAATGATATATAGGAAATG"
print(DNA.find("ATG"))
인쇄를 15
를 인덱싱 참고 : 당신이 DNA 문자열을 가지고 있고 당신은 "ATG"시퀀스의 첫 번째 항목을 찾으려면
from Bio.SeqRecord import SeqRecord
from Bio import SeqIO
def test(seq, start, stop):
start = ["ATG"]
start_codon_index = 0
for frame in range(0,3):
for i in range(frame, len(seq), 3):
current_codon = seq[i:i+3]
if current_codon in start:
start_codons.append(start_codon_index)
return start_codons
f = open("a.fa","r")
start = ["ATG"]
for record in SeqIO.parse(f,"fasta"):
seq=record.seq
name=record.id
start_codons=test(seq, start, stop)
print name, start_codons
무엇이 당신의 질문입니까? – Humbalan