XMLHTTPRequest를 통해로드 된 웹 페이지에서 URL을 추출하는 최적의 방법은 무엇입니까?

문제 개요 나 웹 페이지에 링크 검색 결과로 구성되는 동적 생성 웹 페이지, X, Y1, Y2, Y3 등 XMLHTTPRequest를 통해로드 된 웹 페이지에서 URL을 추출하는 최적의 방법은 무엇입니까?

Y1 리소스의 URL이 포함되어있다

R1, Y2 리소스 URL R2 등을 포함합니다.
동적으로 자원 R1, R2 등 내가 현재 HTML을 검색하기 위해 자바 스크립트와 XMLHttpRequest의 사용 생각하고

가능한 해결 방법에 대한 링크 페이지 X을 강화하고자Y1, Y2 등과 같은 웹 페이지에서 정규 표현식을 사용하여 URL을 추출하십시오.

페이지 Y1, Y2 등은 각각 30-100KB HTML 영역에 있습니다.

좋은 계획 같습니까? 아니면 JSON 형식으로 각 웹 페이지를 검색하고 거기에서 리소스 URL을 추출하는 것이 더 좋을까요? HTML이 가장 좋은 방법이라면 30-100KB의 텍스트를 검색 할 때 권장되는 최적화/단축키가 있습니까?

출처

2011-10-06 Umber Ferrule

URL을 추출하는 데 regex를 사용하지 않으려합니다. jQuery를 사용하여 AJAX 요청을 수행 한 다음 jQuery를 사용하여 서버에서 반환 된 HTML의 URL을 구문 분석하고 필터링하는 것이 좋습니다. jQuery를가 옵션이 아닌 경우 다시 응답을받을 때

jQuery.ajax({ 
    url: "http://my.url.here", 
    dataType: "html"; 
    ... 
    success: function(data) { 
     jQuery("a", data).each(function() { 
      var $link = jQuery(this); 
      ... 
      ... 
     }); 
    } 
    ... 
});

, 당신은 이런 식으로 뭔가를 할 수 있습니다

var html = XHR.responseText; 
var div = document.createElement("div"); 
div.innerHTML = html; 

//you can now search for nodes inside your div. 
//The following gives you all the anchor tags 
div.getElementsByTagName('a'); 
...

출처

2011-10-07 16:58:05

불행히도, jQuery를이 옵션을 선택하지 않습니다. 그러나, 나는 대안의 소리를 좋아한다 - 건배! –

XMLHTTPRequest를 통해로드 된 웹 페이지에서 URL을 추출하는 최적의 방법은 무엇입니까?

답변

관련 문제