2010-06-09 3 views

답변

0

정확히 모든 스크립트 및 스타일 요소를 제거 하시겠습니까? 그것은해야 뭔가 같은 :

''.join(BeautifulSoup(content).findAll(text=lambda text: 
text.parent.name != "script" and 
text.parent.name != "style")) 
+0

그게 바로, 아마도 정규식이 할 수있는 대체하지만, BeautifulSoup로는 tthat을 처리하는 경우 궁금 해서요. 아니면 "간단한 버전의 webstemmer"도 그렇게 할 수 있습니까? – goh

관련 문제