2012-04-26 2 views
1

현재 스크립트 유형 = "text/html"이 가리키는 페이지를 추출하려고합니다.Perl을 사용하여 스크립트 유형 html/text 추출

<script type="text/html" id="pageTemplate"></script> 

내가 pageTemplate의 내용을 다운로드하고 결과를 분석 할 수 있도록하려면 예를 this CNN link를 들어 소스의 라인을 가지고있다. 나는 HTML :: TagParser를 사용하려고 시도해 왔으며 pageTemplate 요소를 가져올 수 있지만 그 내용을 가져올 수는 없다.

+3

아마도 [icanhaz.js] (http://icanhazjs.com/) 또는 비슷한 것을 사용하기 때문에 일부 템플릿 시스템에서 스크립트를 읽고 해석합니다. –

답변

3

마찬가지로 "pageTemplate"에는 내용이 없습니다. 아마도 그것은 html로 숨겨져 있기 때문에 사용하기 때문입니다. "text/html"유형의 스크립트는 실제로 을 수행하지 않습니다.을 수행하십시오. 즉 <script>은 어떤 목적 으로든 표시 할 수없는 표시되지 않은 DOM 요소입니다.

하나의 가능성 : 해당 ID가 사용되는 것에 대한 단서 CNN 페이지와 관련된 자바 스크립트를 통해 http://ejohn.org/blog/javascript-micro-templating/

봐.

+0

FireBug를 사용하고 비디오 위에서 제목 ("Student Loan ...")을 검사하면, 그 아이디가 사용되고 있다고 생각하는 것을 결정할 수 있습니다. 제 질문은 URL이 있으면이 정보에 어떻게 액세스 할 수 있는지입니다. – brendan

+0

LWP :: UserAgent 또는 WWW :: Mechanize를 사용할 수 있습니다. 예를 들어, 방화 광에서 "Net"이 활성화 된 페이지로드를 관찰하여 요청의 정확한 특성을 파악해야 할 수 있습니다. 관련 쿠키가있을 수 있습니다. – delicateLatticeworkFever

관련 문제