내가 파이썬에서 정규 표현식에 약간의 문제가 있어요. 는 HTML 문자열은 다음과 같습니다정규 표현식 비 ASCII 문자
html = <td style="padding-right:5px;"> <span class="blackText">Above £ 7.00 = </span> </td> <td> <span class="blackText"> <p>Free</p> </span> </td>
내가 "7.00"과, 그러나 다음은 작동하지 않습니다 "무료"추출 할 :
양 = re.findall를 (R ' 위의 (£ *.) = ', html)
파이썬은 £ 기호에 대해 비 ASCII 오류를 발생시킵니다. 이 문제를 어떻게 해결할 수 있을까요? 감사.
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – lolopop