태그를 스크립트화하고 해당 내용을 모두 BeautifulSoup을 사용하여 HTML에서 제거 할 수 있습니까? 아니면 정규 표현식이나 다른 것을 사용해야합니까?BeautifulSoup에서 스크립트 태그를 제거 할 수 있습니까?
제 ( official documentation)에 명시된 바와 같이
56
A
답변
110
>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('<script>a</script>baba<script>b</script>', 'lxml')
>>> [s.extract() for s in soup('script')]
>>> soup
baba
12
당신은 검색과 일치하는 모든 하위 트리를 제거 extract
방법을 사용할 수 있습니다.
import BeautifulSoup
a = BeautifulSoup.BeautifulSoup("<html><body><script>aaa</script></body></html>")
[x.extract() for x in a.findAll('script')]
10
나중에 참조 할 수 있도록해야 할 수 있습니다 사람들을 위해 대답을 업데이트
: 정답입니다. decompose()
다른 방법으로도 사용할 수 있지만 decompose
은 제자리에서 작동합니다.
사용 예제 :
soup = BeautifulSoup('<p>This is a slimy text and <i> I am slimer</i></p>')
soup.i.decompose()
print str(soup)
#prints '<p>This is a slimy text and</p>'
꽤 유용
가 너무 등등 '스크립트', 'IMG'같은 이물질을 제거합니다.관련 문제
- 1. jQuery로 스크립트 태그를 만들 수 있습니까?
- 2. WakeLock을 제거 할 수 있습니까?
- 3. Zend Framework에서 액션의 스크립트 제한을 제거 할 수 있습니까?
- 4. 텍스트에서 태그를 제거 하시겠습니까?
- 5. XML에서 움라우트를 어떻게 제거 할 수 있습니까?
- 6. contenteditable 섹션에서 h2 태그를 제거 할 수 없게 만들려면
- 7. BeautifulSoup에서 태그 및 텍스트 찾기
- 8. Python의 BeautifulSoup에서 인라인 파싱
- 9. 태그를 사용하여 UIAlertView에 액세스 할 수 있습니까?
- 10. xml 태그를 regex로 제거
- 11. 언제 베타 태그를 제거 하시겠습니까?
- 12. PHP 페이지의 익스텐트를 제거 할 수 있습니까?
- 13. XML 스키마에서이 중복성을 제거 할 수 있습니까?
- 14. UISearchBar의 색조 이미지를 제거 할 수 있습니까?
- 15. 어떻게 phpPgAdmin을 제거 할 수 있습니까?
- 16. freemarker에서 세션 속성을 제거 할 수 있습니까?
- 17. Jqgrid의 헤더 부분을 제거 할 수 있습니까?
- 18. 어떻게 그림자를 iPhone에서 제거 할 수 있습니까?
- 19. 버튼을 클릭하여 창을 제거 할 수 있습니까?
- 20. LINQ를 사용하여 사전을 "제거"할 수 있습니까?
- 21. 동적 클래스에서 속성을 제거 할 수 있습니까?
- 22. 어떻게하면 이것을 제거 할 수 있습니까?
- 23. Popover보기에서 화살표를 제거 할 수 있습니까?
- 24. 프로덕션에서 schema.rb를 제거 할 수 있습니까?
- 25. GET에서 'execution'매개 변수를 제거 할 수 있습니까?
- 26. 개체 자체를 제거 할 수 있습니까? 방법?
- 27. 어떻게이 스크롤바를 제거 할 수 있습니까?
- 28. 어떻게이 apn_on_rails 보석을 제거 할 수 있습니까?
- 29. 어떻게 cell.imageView를 제거 할 수 있습니까?
- 30. gemfile에서 보석 버전을 제거 할 수 있습니까?
제거 할 추가 태그를 연결하는 가장 좋은 방법은 무엇입니까? 현재 명령을 하나씩 반복하면 수프 ('스크립트')에서 s를 위해 s.extract()를 수행 한 다음 스프 ('iframe')에서 s를} [s.extract()] 등으로 작동합니다. ,하지만 내가 수프 ('iframe', 'script')의 s를 위해 s.extract()를 연결하는 경우에는 그렇지 않습니다. – Ila
@Ali 수프 ([ 'iframe', 'script'])]]에서 s에 대해 [s.extract()를 사용해야합니다. 다중 태그를 사용하려면 매개 변수가 목록이어야합니다. –
@ FábioDiniz '' baba 의'? 똑같은가요? – user2883071