2011-10-06 8 views
0

문제 개요 나 웹 페이지에 링크 검색 결과로 구성되는 동적 생성 웹 페이지, X, Y1, Y2, Y3XMLHTTPRequest를 통해로드 된 웹 페이지에서 URL을 추출하는 최적의 방법은 무엇입니까?

  • Y1 리소스의 URL이 포함되어있다

    • R1, Y2 리소스 URL R2 등을 포함합니다.
    • 동적으로 자원 R1, R2 등 내가 현재 HTML을 검색하기 위해 자바 스크립트와 XMLHttpRequest의 사용 생각하고

    가능한 해결 방법에 대한 링크 페이지 X을 강화하고자Y1, Y2 등과 같은 웹 페이지에서 정규 표현식을 사용하여 URL을 추출하십시오.

    페이지 Y1, Y2 등은 각각 30-100KB HTML 영역에 있습니다.

    좋은 계획 같습니까? 아니면 JSON 형식으로 각 웹 페이지를 검색하고 거기에서 리소스 URL을 추출하는 것이 더 좋을까요? HTML이 가장 좋은 방법이라면 30-100KB의 텍스트를 검색 할 때 권장되는 최적화/단축키가 있습니까?

  • 답변

    1

    URL을 추출하는 데 regex를 사용하지 않으려합니다. jQuery를 사용하여 AJAX 요청을 수행 한 다음 jQuery를 사용하여 서버에서 반환 된 HTML의 URL을 구문 분석하고 필터링하는 것이 좋습니다. jQuery를가 옵션이 아닌 경우 다시 응답을받을 때

    jQuery.ajax({ 
        url: "http://my.url.here", 
        dataType: "html"; 
        ... 
        success: function(data) { 
         jQuery("a", data).each(function() { 
          var $link = jQuery(this); 
          ... 
          ... 
         }); 
        } 
        ... 
    }); 
    

    , 당신은 이런 식으로 뭔가를 할 수 있습니다

    var html = XHR.responseText; 
    var div = document.createElement("div"); 
    div.innerHTML = html; 
    
    //you can now search for nodes inside your div. 
    //The following gives you all the anchor tags 
    div.getElementsByTagName('a'); 
    ... 
    
    +0

    불행히도, jQuery를이 옵션을 선택하지 않습니다. 그러나, 나는 대안의 소리를 좋아한다 - 건배! –

    관련 문제