2012-03-30 3 views
0

이 웹 페이지 http://www.realtor.com/search/searchresults.aspx?mlslid=120012971&source=web을 다운로드하려면 PHP_get_contents 또는 curl을 사용하십시오.이 코드를 사용하고 있습니다.팝업창에서 file_get_contents()가 작동하지 않습니다.

<?php 

function get_contents($url) 
{ 
    $ch = curl_init(); 
    curl_setopt ($ch, CURLOPT_URL, $url); 
    curl_setopt ($ch, CURLOPT_HEADER, 0); 
    ob_start(); 
    curl_exec ($ch); 
    curl_close ($ch); 
    return ob_get_clean(); 
} 

$url = "http://www.realtor.com/search/searchresults.aspx?mlslid=120012971&source=web"; 

//$html = file_get_contents($url); 
$html = get_contents($url); 

echo $html; 
?> 

이틀 전에 두 프로세스 모두 잘 작동했습니다. 그러나 지금이 페이지를 다운로드하는 문제를 만들고있는 팝업 창이 있습니다. 원래 웹 페이지를 다운로드하기 위해 팝업 창을 우회 할 수있는 방법이 있습니까 ??

+0

FYI, 나는 여기에서 Realtor.com의 이용 약관에 위배됩니다. 말할 것도없이, 스크래핑은 마크 업을 변경할 때 항상 깨지게됩니다. 당신은 trulia 또는 zillow가 제안한 부동산 API를 사용하는 것이 더 나을 수도 있습니다. –

답변

0

웹 페이지와의 상호 작용이 필요한 것처럼 들립니다. 다중 액션 대화 형 웹 경험을 스크립팅하려면 Selenium과 같은 자동화 도구를 사용해야합니다. 이 제품군을 사용하면 DOM 및 JavaScript 기반 응용 프로그램과의 상호 작용을 스크립팅 할 수 있습니다.

+0

어떻게이 특별한 경우에 셀레늄을 사용할 수 있습니까 ?? – qmaruf

+0

그건 완전히 다른 질문입니다. – buley

관련 문제