2013-06-07 1 views
1

나는 다음과 같은 FASTA 파일이 있습니다단백질 fasta 파일을 읽고 Arginine (R)에서 읽기 문자열을 분할 한 다음 펩타이드를 블래스트하여 일치 항목을 얻으시겠습니까?

'>gi|277456704|dbj|ID_P|Gene name LLL 
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKV 
YRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFG 
EVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLEL 
MAGGDLKSFLRETRPRPSQPSSLAMLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKI 
GDFGMARDIYRASYYRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEV 
LEFVTSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEEE 

'>gi|27704|dbj|ID_Y|Gene name JJJ 
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKG 
SELRGGYGDPGRLPVGSGLCSASRARLPGHVAADHPPAVYRRKHQELQAMQMELQSPEYKLSKLRTSTIM 
TDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQ 
DELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLAMLDLLHV 
ARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGGCAMLPVKWMPPE 

'>gi|2097704|dbj|ID_X|Gene name X 
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKG 
QPSPRAVIPMSCITNGSGANRKPSHTSAVSIAGKETLSSAAKSGTEKKKEKPQGQREKKEESHSNDQSPQ 
IRASPSPQPSSQPLQIHRQTPESKNATPTKSIKRPSPAEKSHNSWENSDDSRNKLSKIPSTPKLIPKVTK 
TADKHKDVIINQEGEYIKMFMRGRPITMFIPSDVDNYDDIRTELPPEKLKLEWAYGYRGKDCRANVYLLP 
TGEIVYFIASVVVLFNYEERTQRHYLGHTDCVKCLAIHPDKIRIATGQIAGVDKDGRPLQPHVRVWDSVT 
LSTLQIIGLGTFERGVGCLDFSKADSGVHLCVIDDSNEHMLTVWDWQRKAKGAEIKTTNEVVLAVEFHPT 

내가 FASTA을 반복하고 싶습니다를, 그것은 우연히 만나는 모든 'R'이 다음 BLASTP 펩타이드를 펩타이드를 생성합니다에서 단백질 서열을 분할합니다. blastp에서 결과를 가져 와서 blastp 결과를 fasta 파일의 각 단백질 ID 별 파일에 저장하십시오. 나는 어떤 언어가 사용되는지에 대해 특별히 신경 쓰지 않는다. 이 기능을 통해 어떻게하면 더 많은 기능을 구현할 수 있는지 배우고 싶습니다. 감사합니다. Biopython

+0

을 당신은 또한 HTTP를 요청할 수있다 :.. // www.biostars.org – Pierre

+2

@Pierre : Biostars를 추천 해 주셔서 감사합니다.하지만 운영자가 너무 무례하고 질문을 downvote하거나 닫을 때 편안하게 게시 할 수 없습니다. – RnD

+0

귀하의 의견은 여기에서 논의되었습니다 : http : // www. biostars.org/p/73956/ – Pierre

답변

관련 문제