fasta 헤더를 제거하고 단백질 시퀀스를 문자열로 사용하여 변수를 만드는 추한 코드를 작성했습니다. 어떻게하면 더 효율적으로 할 수 있을까요? biopython에서 이것을 수행하는 좋은 방법이 있습니까? 내가 가장 많이 해 봤는데 실제로 무엇을, 언제 내 순서를 :fasta 파일에서 헤더를 제거하는 효율적인 방법 찾기 시도
f = open('protein1.fasta', 'r')
raw_samples = f.readlines()
f.close()
samples = ''
for elem in raw_samples:
if elem[0] == '>':
raw_samples = elem[1:].rstrip()
else:
samples += elem.rstrip()
print samples
반복하는 동안 'raw_samples'를 덮어 쓰는 것입니다. 모든 샘플을 유지하는 대신 단일 요소로 설정하는 것입니다. 너가 너가 생각하는 것을 못 얻는 것 같아. –