2014-11-05 1 views
0

미리 영어로 죄송합니다. 사이트에 파서를 작성했지만 그의 모든 페이지는 입력 된 데이터를 HTML5 로컬 저장소에 저장합니다. 페이지에서 이미지를 클릭하고이 클릭 후 데이터 저장 공간에 저장된 모든 변수 값을 검색하는 것은 정말 에뮬레이트됩니까? 예를 들어, jsdom (https://github.com/tmpvar/jsdom)과 같은 NodeJS + 파서를 사용 하시겠습니까? 아니면 이에 대한 대안 기술을 사용할 수 있습니까? 감사합니다.HTML5 로컬 저장소를 사용하는 페이지를 구문 분석하는 방법은 무엇입니까?

답변

0

많은 자바 스크립트로 웹 사이트를 구문 분석하려고하는 것처럼 들립니다. phontom을 사용하여 사용자 동작을 시뮬레이션 할 수 있습니다. 노드를 사용하려고한다고 가정하십시오. 그런 다음 Node-Phontom을 사용하면됩니다.

var phantom=require('node-phantom'); 
phantom.create(function(err,ph) { 
    return ph.createPage(function(err,page) { 
    return page.open("you/url/", function(err,status) { 
     console.log("opened site? ", status); 
     page.includeJs('http://ajax.googleapis.com/ajax/libs/jquery/1.7.2/jquery.min.js', function(err) { 
     //jQuery Loaded. 
     //Settimeout to wait for a bit for AJAX call. 
     setTimeout(function() { 
      return page.evaluate(function() { 
      //Get what you want from the page 
      //e.g. localStorage.getItem('xxx'); 
     }, 5000); 
     }); 
    }); 
    }); 
}); 

Here is phontom.

Here is node-phontom.

관련 문제