일부 텍스트가 있습니다. 여기에서 볼 수 있습니다.쉼표 또는 공백으로 된 텍스트 찾기
result1 = [('aqua', 'fem nom/voc pl'), ('aqua', 'fem dat sg'), ('aqua', 'fem gen sg')]
result2 = [('equus#1', 'masc abl sg'), ('equus#1', 'masc dat sg')]
을 두 변형 될 수있다 여기에서 보는 바와 같이 :
- (anytext) (워드-I-필요) \ t 여기
내가 얻고 싶은 것입니다 \ t (form-I-need).str1 = '{5723647 9 aqua\t \tfem nom/voc pl}{5723647 9 aqua\t \tfem dat sg}{5723647 9 aqua\t \tfem gen sg}' str2 = '{27224035 2 equo_,equus#1\t \tmasc abl sg}{27224035 2 equo_,equus#1\t \tmasc dat sg}'
- (anytext) (단어 - 필요) \ t \ t (양식 - 필요).
[('aqua', 'fem nom/voc pl'), ('aqua', 'fem dat sg'), ('aqua', 'fem gen sg')] [('equo_,equus#1', 'masc abl sg'), ('equo_,equus#1', 'masc dat sg')]
그러나, 두 번째는해야합니다 :
여기pattern = re.compile(r'\d* \d*(?:,|)(.*?)\t \t(.*?)}')
내가 무엇을 얻을 수 있습니다 : 여기
내가 무엇을 시도했다 정규식
[('equus#1', 'masc abl sg'), ('equus#1', 'masc dat sg')]
무엇 조언 해 줄래? 감사!
무엇입니까이 경우의 예상 출력 :'23467 23 sfhd, 자유 소프트웨어 재단 \ t \ tydfjskdfk' – nhahtdh
@nhahtdh FDS :이 수 그런 끈이 아니야. – ghostmansd