두 개의 시퀀스가 들어있는 파일이 있습니다. 나는 모든 서열을 읽고, 함께 결합하고, 두 서열의 길이를 함께 표시 할 수있는 프로그램을 가지고있다. 이제 길이를 개별적으로 표시하려고합니다. 두 시퀀스는 기호 >
으로 구분됩니다.파일에 개별 시퀀스의 길이 표시
예 :
SEQ1 >ATGGGACTAGCAGT
SEQ2 >AGGATGATGAGTGA
프로그램 : 내가 제대로 이해하면
#!usr/bin/python
import re
fh=open('clostp1.fa','r')
count=0
content=fh.readlines()
fh.close()
seq=''
patt=re.compile('>(.*?)')
for item in content:
m=patt.match(item)
if not m:
s=item.replace('\n','')
seq=seq+s
seq=seq.replace('\s','')
print seq
print 'The length of the coding sequence of the bacillus'
print len(seq)
비 탐욕스러운 패턴 부분 (코드에서'..? ')은 항상 빈 문자열과 일치하므로 패턴 끝에는 의미가 없습니다. –