2009-12-30 9 views
2

나는 Ruby를 Nokogiri 모듈과 함께 사용하고 있으며 스크립트 요소없이 본문 내용을 가져 오려고합니다.<script> HTML 요소 제거

Nokogiri 구문 분석은 XPATH 또는 CSS 3.0을 사용합니다. XPATH 난 정말 이해가 안 돼요, 그리고 내 목표를 달성하기 위해 CSS를 선택 찾을 수 없습니다.

답변

8

XPath에서는 그러한 선택이 가능하지 않다고 생각합니다.

저는 Ruby 나 Nokogiri에 익숙하지 않지만 answers to a similar question을 기반으로 HTML 문서에서 모든 스크립트 요소를 선택하여 제거하려고 할 수 있습니다.

doc = Nokogiri::HTML(your_html) 
doc.xpath("//script").remove 

조정하십시오.