각괄호로 묶이지 않은 텍스트를 가져와야합니다.기울임 괄호로 묶이지 않은 텍스트의 정규식 - 파이썬
> whatever something<X="Y" zzz="abc">this is a foo bar <this is a
> < whatever>and i ><only want this
원하는 출력은 다음과 같습니다 :
내 입력은 다음과 같다 내가 먼저 제거 괄호 안에있는 것을 감지 시도했습니다
> whatever something
this is a foo bar <this is a
>
and i ><only want this
. 하지만 <>
대신에 전체 <...>
대신 속성을 일치시키는 것 같습니다. 원하는 출력을 얻으려면 어떻게해야합니까?
import re
x = """whatever something<X="Y" zzz="abc">this is a foo bar <this is a\n< whatever>and i ><only want this"""
re.findall("<([^>]*)>", x.strip())
['X="Y" zzz="abc"', 'this is a\n ', ' whatever']
왜 ''이 출력에서 제거되지 않습니까? –
파이썬을 사용하지는 않지만이 '<.+?>'는 샘플 데이터에서 바꾸어야 할 모든 것을 일치시킵니다. 이것은 할 것인가? 스니퍼는 요점이 있습니다. 나는 단지''=이기 때문에 당신이 원하지 않는 것을 제거하겠다고 생각했다. ' –
gwillie
. 어떤 태그도'\ n'을 갖지 않을 것이라고 가정합니다. – alvas