그래서 내가 서버에서 이러한 파일이 다음 토큰 값을 캡처하는 방법이있다 :는 pharse을 찾아
COADREAD ATF7 Missense_Mutation NGXA-AZ-3984 P17544의 A436T을
COADREAD ATG10 Missense_Mutation NGXA-AB -A010 Q9H0Y0 H133N
내 목표는 파일의 5 열에서 캡처/저장 (그 번호를 나중에 인쇄해야 함) 436 인 토큰의 번호 (P17544)를 찾는 것입니다. 이 숫자는 6 열의 A436T에서 두 글자 사이에있는 것으로 가정합니다. 내가 할 수있는 방법이 있습니까? 이전에 lxml로 약간 작업했지만 어떻게해야할지 아직 확신하지 못했습니다. 여기
사전
에 감사 내가파일 = 개방 ('text.txt', 'R')
조회가 무엇인가 = {} 파일의 라인
:
myid, token = file.rsplit(' ', 2)[1:]
token = token[1:-1]
이 인코딩 유형의 이름은 무엇입니까? –
@ K.Brafford 그냥 일반 텍스트 파일 –
@ChadD, 아마 ASCII 그럼? – TankorSmash