내 캐릭터는 여기파이썬
mystring = "<tr><td><span class='para'><b>Total Amount : </b>INR (Indian Rupees)
100.00</span></td></tr>"
내 문제는 내가 검색하고 전체 양
test = re.search("(Indian Rupees)(\d{2})(?:\D|$)", mystring)
를 얻을 수 있지만, 내 테스트 나에게 없음을주지해야된다. 어떻게 가치와 값은 10.00, 100.00, 1000.00
감사
잘 형식화 된 HTML의 경우 lxml은 훌륭합니다. BeautifulSoup는 그렇지 않은 HTML과 함께 훌륭합니다. – vy32
lxml은 완전한 "태그 수프"가 아니라면 깨진 HTML을 꽤 잘 다룰 수 있습니다. 물론 –
@ vy32 lxml은 많은 것들에 대해 BS보다 잘 작동하며, BS의 파싱 (lxml을 통해)을 사용할 수 없습니다. html.soupparser'). HTML5 구문 분석 규칙을 사용하려면 html5lib ('lxml.html.html5parser')도 사용할 수 있습니다. 그래서 lxml을 사용하면 가장 많은 옵션을 제공하고 실제로 유지 관리됩니다. –