나는 아주 비슷한 것을 일전에했습니다. jQuery, Ajax, PHP를 사용하여 페이지를 수집하고 무너 뜨 렸습니다. 내 코드의 희석 된 버전을 포함 시켰습니다.
$requestURL = $_GET['url'];
$curl_handle=curl_init();
curl_setopt($curl_handle, CURLOPT_URL, $requestURL);
curl_setopt($curl_handle, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($curl_handle, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($curl_handle, CURLOPT_AUTOREFERER, TRUE);
curl_setopt($curl_handle, CURLOPT_FRESH_CONNECT, TRUE);
curl_setopt($curl_handle, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($curl_handle, CURLOPT_MAXREDIRS, 10);
curl_setopt($curl_handle, CURLOPT_DNS_USE_GLOBAL_CACHE, FALSE);
curl_setopt($curl_handle, CURLOPT_FORBID_REUSE, TRUE);
$content = curl_exec($curl_handle);
curl_close($curl_handle);
echo $content;
그런 다음 아약스를 위해 내가 사용 :
var url = /* URL you want to retrieve */;
$.ajax({
url: "get-url.php?url=" + url,
type: "GET",
dataType: "html",
cache: false,
success: function(data, textStatus, jqXHR){
var header = data.find('#header').html();
var footer = data.find('#footer').html();
$(header_DOM).html(header);
$(footer_DOM).html(footer);
}
});
이 그냥 가이드
는 PHP를 위해 나는 CURL (GET-url.php)을 사용했다. 이 아이디어를 필요에 맞게 변경하십시오.
나는 substring/regex를 호출하지 않을 것입니다 ** ** 충분한 도구를 가지고 있습니다 –
답장을 보내 주셔서 감사합니다. 어쨌든 DOM 구문 분석은 바닥 글을위한 최선의 방법 일 것이라고 생각하지만 헤더에 대해 뭔가 다른 것이 필요할 수도 있습니다. 이전에 생각했던대로 구조화되지 않았기 때문입니다. – MillyMonster
@MillyMonster, 문서는 구조화 된 문서로 구문 분석됩니다. – Brad