Python 2.7.2에서 regex를 사용하여 문자열에서 태그가있는 단어를 모두 추출하려고합니다. 또는 단순히 [p][/p]
태그 안에있는 모든 텍스트를 추출하고 싶습니다. ['[P] Barack Obama [/P]', '[P] Bill Gates [/p]']
또는 ['Barrack Obama', 'Bill Gates']
를 : 얻을 수있는 올바른 정규식이 무엇 person
이 ['President [P]', '[/P]', '[P] Bill Gates [/P]']
Python regex findall
을 생산
regex = ur"[\u005B1P\u005D.+?\u005B\u002FP\u005D]+?"
line = "President [P] Barack Obama [/P] met Microsoft founder [P] Bill Gates [/P], yesterday."
person = re.findall(pattern, line)
인쇄 : 여기 내 시도이다.
감사합니다. :)
정말이 답변있다. 일치 항목 만 처리하려는 경우 1) 목록 저장, 2) 목록 처리는 str = 'purple [email protected], blah monkey [email protected]과 동일하지 않습니다. blach dishwasher ' ## re.findall()은 발견 된 모든 전자 메일 문자열의 목록을 반환합니다. emails = re.findall (r'[\ w \ .-] + @ [\ w \ .-] + ' str) ## [ '[email protected]', 'bob @ abc.com]] 이메일에 대한 이메일 : # 각각의 이메일 문자열에서 뭔가를 수행하십시오. 인쇄 이메일 – kkron