2017-10-10 4 views
0

데이터 프레임에 하나의 열이 있는데 다섯 번째 구분 기호 "."앞에 문자열의 일부를 제거하고 싶습니다. 그리고 마지막 "." .txt와 나는 그것을 어떻게 해야할지 모른다.R 구분 기호 앞에 문자열을 제거하십시오.

입력 :

jhu-usc.edu_GBM.HumanMethylation450.6.lvl-3.TCGA-06-5415-01A-01D-1481-05.txt 
jhu-usc.edu_BCD.HumanMethylation450.6.lvl-3.TCGA-06-5415-01A-01D-1482-05.txt 
jhu-usc.edu_LGG.HumanMethylation450.6.lvl-3.TCGA-06-5415-01A-01D-1483-05.txt 
jhu-usc.edu_LUAD.HumanMethylation450.6.lvl-3.TCGA-06-5415-01A-01D-1484-05.txt 
jhu-usc.edu_LUAD.HumanMethylation450.6.lvl-3.TCGA-06-5415-01A-01D-1485-05.txt 
jhu-usc.edu_BRCA.HumanMethylation450.6.lvl-3.TCGA-06-5415-01A-01D-1486-05.txt 
jhu-usc.edu_GBM.HumanMethylation450.6.lvl-3.TCGA-06-5415-01A-01D-1487-05.txt 
jhu-usc.edu_PRCA.HumanMethylation450.6.lvl-3.TCGA-06-5415-01A-01D-1488-05.txt 

원하는 출력 :

TCGA-06-5415-01A-01D-1481-05 
TCGA-06-5415-01A-01D-1482-05 
TCGA-06-5415-01A-01D-1483-05 
TCGA-06-5415-01A-01D-1484-05 
TCGA-06-5415-01A-01D-1485-05 
TCGA-06-5415-01A-01D-1486-05 
TCGA-06-5415-01A-01D-1487-05 
TCGA-06-5415-01A-01D-1488-05 

는 I 시도 : sapply (strsplit (as.character (DF $으로 된 V1)을) "["1 "." : 5)

조언을 구하십시오. 고맙습니다. 그들은 .txt 모든 끝은 당신이 할 수있는 경우 텍스트가

sub(".*(TCGA[^.]+).*", "\\1", str1) 

답변

0

sub(".+\\.([^.]+).txt", "\\1", as.character(df$V1)) 
0

고정된다고 가정

관련 문제