2012-11-06 9 views
0

re.sub, python 2.7을 사용하여 html 파일의 텍스트 청크를 'xxx'로 바꾸려고합니다. 공백이나 줄 바꿈이없는 기본 문자열로만 작업 할 수 있습니다. 이 코드는 대체 할 항목이 없습니다. 나는 DOTALL과 다른 것들을 시도했지만 아무것도 작동하지 않습니다. 그냥 전체 파일을 인쇄합니다. re.search를 성공적으로 사용했지만 작동하지 않습니다.reins in python 2.7

CODE :

print re.sub(r'table\sstyle\=(.+)script', r'xxx', text, re.S) 

를 검색하고 (텍스트)는

<table style="background-color: #ecddb0"> 
<tbody> 
<TR> 
<TD> 
<style type="text/css"> 
body { 
background-color: #ffffff; 
margin: 0px; 
padding: 0px 0 0 0px; 
</style> 
<script type="text/javascript 
+2

의무 링크 : - 경우 http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 당신은 flags을 설정하려면 당신은 물건을 위생적으로 만들고 싶습니다. – ThiefMaster

+0

@ ThiefMaster가 말한 것! 또한'(. +?)'일 수도 있습니다. – Nadh

답변

4

re.sub의 네 번째 인수 count이다.

re.sub(r'table\sstyle\=(.+)script', r'xxx', text, flags=re.S) 
+0

감사합니다. 그것을 시도 할 것이다. – user1802244