두 가지 유형의 파일이 있습니다. 또 다른 타격으로 선 포함두 형식을 모두 처리하는 RE
"55.28 LongUrl0.20s: Preplan Async"
:
한
아래와 같은 라인이 포함되어>55.28 LongUrl0.20s: Preplan Async</a></span><br></td>
두 경우 모두를, 나는 내용이 LongUrl
로 시작하고 끝나는 좀하고 싶습니다 </a>
또는 행의 끝.
>>> b="55.28 LongUrl0.20s: Preplan Async"
>>> a=">55.28 LongUrl0.20s: Preplan Async</a></span><br></td>"
>>> re.findall(r'LongUrl\d*.\d*s:[^<]+',a)
['LongUrl0.20s: Preplan Async']
>>> re.findall(r'LongUrl\d*.\d*.*$',b)
['LongUrl0.20s: Preplan Async']
둘 다 포함 할 수있는 단일 RE를 사용할 수 있습니까?
답장을 보내 주셔서 감사합니다. longUrl 문자열 다음에 숫자가 있는지 확인하고 문자열 뒤에 숫자가없는 항목을 무시해야합니다. – user2716941
@ user2716941 그런 다음 질문에 답하십시오! ** 특히 ** 정규 표현식과 같은 것을 다룰 때 ** 모든 요구 사항을 제공하는 것이 중요합니다. 그게 유일한 추가 요구 사항이라면, 이것은 쉬운 수정입니다 : 위의'r'LongUrl \ d + [^ <] * ''에서 정규 표현식을 만듭니다. –
@ user2716941 예, 대답을 변경했습니다 ('LongUrl' 이후의 숫자를 확인하기 위해'\ d +'포함). – alecxe