단백질 fasta 파일을 읽고 Arginine (R)에서 읽기 문자열을 분할 한 다음 펩타이드를 블래스트하여 일치 항목을 얻으시겠습니까?

나는 다음과 같은 FASTA 파일이 있습니다단백질 fasta 파일을 읽고 Arginine (R)에서 읽기 문자열을 분할 한 다음 펩타이드를 블래스트하여 일치 항목을 얻으시겠습니까?

'>gi|277456704|dbj|ID_P|Gene name LLL 
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKV 
YRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFG 
EVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLEL 
MAGGDLKSFLRETRPRPSQPSSLAMLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKI 
GDFGMARDIYRASYYRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEV 
LEFVTSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEEE 

'>gi|27704|dbj|ID_Y|Gene name JJJ 
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKG 
SELRGGYGDPGRLPVGSGLCSASRARLPGHVAADHPPAVYRRKHQELQAMQMELQSPEYKLSKLRTSTIM 
TDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQ 
DELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLAMLDLLHV 
ARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGGCAMLPVKWMPPE 

'>gi|2097704|dbj|ID_X|Gene name X 
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKG 
QPSPRAVIPMSCITNGSGANRKPSHTSAVSIAGKETLSSAAKSGTEKKKEKPQGQREKKEESHSNDQSPQ 
IRASPSPQPSSQPLQIHRQTPESKNATPTKSIKRPSPAEKSHNSWENSDDSRNKLSKIPSTPKLIPKVTK 
TADKHKDVIINQEGEYIKMFMRGRPITMFIPSDVDNYDDIRTELPPEKLKLEWAYGYRGKDCRANVYLLP 
TGEIVYFIASVVVLFNYEERTQRHYLGHTDCVKCLAIHPDKIRIATGQIAGVDKDGRPLQPHVRVWDSVT 
LSTLQIIGLGTFERGVGCLDFSKADSGVHLCVIDDSNEHMLTVWDWQRKAKGAEIKTTNEVVLAVEFHPT

내가 FASTA을 반복하고 싶습니다를, 그것은 우연히 만나는 모든 'R'이 다음 BLASTP 펩타이드를 펩타이드를 생성합니다에서 단백질 서열을 분할합니다. blastp에서 결과를 가져 와서 blastp 결과를 fasta 파일의 각 단백질 ID 별 파일에 저장하십시오. 나는 어떤 언어가 사용되는지에 대해 특별히 신경 쓰지 않는다. 이 기능을 통해 어떻게하면 더 많은 기능을 구현할 수 있는지 배우고 싶습니다. 감사합니다. Biopython와

출처

2013-06-07 RnD

을 당신은 또한 HTTP를 요청할 수있다 :.. // www.biostars.org – Pierre

@Pierre : Biostars를 추천 해 주셔서 감사합니다.하지만 운영자가 너무 무례하고 질문을 downvote하거나 닫을 때 편안하게 게시 할 수 없습니다. – RnD

귀하의 의견은 여기에서 논의되었습니다 : http : // www. biostars.org/p/73956/ – Pierre

을 수행 할 수 있습니다 parse the FASTA file Sequence, 물체, "R"에서 split, 다음 BLAST over the internet 또는 run BLAST locally. 당신은 iterating over each record에 의해 SeqRecords 및 output them to a FASTA file로 표현 결과를 (이 걸릴 수

을 문서 당신이 찾고있는 조각 같이하는 데 사용할 수있는 코드 샘플을 많이 가지고

출처

2013-06-08 00:12:27

단백질 fasta 파일을 읽고 Arginine (R)에서 읽기 문자열을 분할 한 다음 펩타이드를 블래스트하여 일치 항목을 얻으시겠습니까?

답변

관련 문제