내가 div
인 페이지가 있다고 가정 해 보겠습니다. soup.find()
으로 쉽게 해당 div를 얻을 수 있습니다.BeautifulSoup innerhtml?
결과가 생겼으니, div
의 전체 innerhtml
을 인쇄하고 싶습니다. 즉, 모든 HTML 태그와 텍스트를 모두 포함하는 문자열이 필요합니다. 정확하게 문자열과 같습니다. obj.innerHTML
으로 자바 스크립트를 사용하십시오. 이것이 가능한가?
innerhtml = "".join([str(x) for x in div_element.contents])
유니 코드 (x는) –
안전 할 수있는이와 몇 가지 다른 문제가 있습니다. 첫째, 문자열 요소 내에서 html 엔티티 (예 :보다 크거나 작음)를 이스케이프 처리하지 않습니다. 두 번째로 주석 내용은 쓰지만 주석 태그 자체는 쓰지 않습니다. – ChrisD
@ChrisD 주석에 이것을 사용하지 않는 다른 이유 추가 : 비 ASCII 문자가 포함 된 내용에 UnicodeDecodeError가 발생합니다. – Anthon