2013-05-15 2 views
1

PHP에서 CURL을 사용하여 쇼핑 사이트 웹 페이지를 구문 분석하려고합니다.
URL은 다음과 같습니다. http://computers.pricegrabber.com/printers/HP-Officejet-Pro-8600-Plus-All-One-Wireless-Inkjet-Printer/m916995235.html/zip_code=97045/sort_type=bottomline
다음은 내가 사용하는 코드입니다.CURL이 전체 HTML 내용을 제공하지 않습니다.

function getWebsiteCURL($url) 
{ 
$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $url); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); 
curl_setopt($ch, CURLOPT_FRESH_CONNECT, true); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
$output = curl_exec($ch); 
curl_close($ch); 

return $output; 
} 

echo getWebsiteCURL("http://computers.pricegrabber.com/printers/HP-Officejet-Pro-8600-Plus-All-One-Wireless-Inkjet-Printer/m916995235.html/zip_code=97045/sort_type=bottomline"); 

작동하지만 전체 HTML 코드를 가져올 수 없습니다.
아무도 이유가 무엇입니까? TIA.

+1

페이지 사용 자바 스크립트. 스크립트가 추가 한 내용은 cURL로 표시되지 않습니다. – Barmar

+0

전체 내용을 가져 오는 다른 방법이 있습니까? – ordinaryman09

+0

Javascript 인터프리터를 실행해야하는데 어떻게해야할지 모르겠다. – Barmar

답변

0

이것은 종종 연결 시간 초과로 인해 발생합니다.

은 수신 거부를 설정하십시오 : => 120

0

CURLOPT_TIMEOUT을 자바 스크립트를 해석 할 수없는, 당신은 당신이 브라우저에서 자바 스크립트를 비활성화하고 페이지로 이동하면 볼 수 곱슬 곱슬 것을 볼 수 있습니다. Javascript를 해석해야한다면 phantomjs와 같은 헤드리스 브라우저를 사용할 것입니다. PHP에서는 PHP PhantomJS을 사용할 수 있습니다.

관련 문제