2016-10-09 2 views
-5

나는이 정규 표현식이 있습니다! 문자열 소요정규 표현식 제거 <[CDATA [

</title>[\s]*<description[^>]*>(.*?)<img 

: 나는 또한 제거하려면이 정규 표현식을 편집 할 수있는 방법을

<title>Insane price of last Ford Falcon V8s</title> 
     <description><![CDATA[FORD dealers are charging a staggering $30,000 more than the recommended retail price — up from $60,000 to $90,000 — for the final Falcon V8 sedans as buyers try to secure a future classic.<img alt="" border="0" src="https://pixel.wp.com/b.gif?host=www.couriermail.com.au&#038;blog=87782261&#038;post=1205849&#038;subd=couriermailatnewscorpau&#038;ref=&#038;feed=1" width="1" height="1" />]]></description> 

<![CDATA[

답변

0

정규식은 정말 유용한 도구입니다. 여기에는 버그를 코드에 넣을 위험이 높습니다. 특히 정확하게 처리하는 방법을 모르는 경우에는 더욱 그렇습니다 (이 경우가 여기에 해당하는 것 같습니다).

항상 파이썬의 내장 문자열 클래스로 가서 만 필요하면 RegEx를 사용하십시오. 이 경우에는 "LO"에 대한

my_str = "hello world" 
my_str.replace("lo", "") 
>>> "hel world" 

str.replace 검색하고 삭제하여, ""(아무것도로 대체 : 당신이 당신의 문자열 my_str이있는 경우

는, 다음 코드는 my_str에 문자열을 대체). 물론 원하는대로이 값을 변경할 수 있습니다.

Python's documention for Strings을 살펴보십시오.