2016-07-06 5 views
1

이 형식으로 태그를 찾는 패턴이 있습니다 : <. * :. *>. 중첩 태그에서 하위 태그 만 가져옵니다. 여기서 '/ <'과 '/>'에서 대괄호 (< 및>)를 구분해야합니다. 동일한 패턴 자체에서이 작업을 수행 할 수있는 방법이 있습니까?파이썬에서/<from <을 구별하십시오

예 : 입력 문자열

<testing this> any text </<this is not a tag>any text<this will fail/>> 

출력 :

['<testing this>','</<this is not a tag>','<this will fail/>>'] 

어떤 제안을 알려 주시기 바랍니다.

+3

그것은 당신이 정규식 [X] HTML을 구문 분석하려고하는 불편 것 같습니다. [하지 마십시오.] (http://stackoverflow.com/a/1732454/3001761) 파서를 사용하십시오. – jonrsharpe

+1

RegEx를 사용하려면 LookBehind를 사용해야합니다. – CodenameLambda

+0

'/ <'는 무엇을 의미합니까? 당신은 그것이' Aprillion

답변

0

사용이 패턴은 :

(?<!/)<.*?(?<!/)> 

(?<!/) 실제로 문자를 사용하지 않고 각 < 또는 >의 바로 왼쪽에 슬래쉬가없는 보장 부정적인 lookbehind이다.

Check this pattern out on regex101.com

관련 문제