저는 cURL을 처음 사용합니다. this amazon link의 내용 (예 : 이미지, 책 제목, 저자 및 20 권의 책)을 html 페이지로 긁어 내려고 노력했습니다. 지금까지 나는 아래의 코드를 사용하여 페이지를 인쇄하고있다.PHP 및 cURL을 사용하여 div 내용 스크랩
<?php
function curl($url) {
$options = Array(
CURLOPT_RETURNTRANSFER => TRUE,
CURLOPT_FOLLOWLOCATION => TRUE,
CURLOPT_AUTOREFERER => TRUE,
CURLOPT_CONNECTTIMEOUT => 120,
CURLOPT_TIMEOUT => 120,
CURLOPT_MAXREDIRS => 10,
CURLOPT_URL => $url,
);
$ch = curl_init();
curl_setopt_array($ch, $options);
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
?>
$url = "http://www.amazon.in/gp/bestsellers/books/1318209031/ref=zg_bs_nav_b_2_1318203031";
$results_page = curl($url);
echo $results_page;
나는 정규 표현식을 사용해 보았는데 실패했다. 나는 6hrs를 위해 가능한 모든 것을 똑바로 시도하고 진짜로 피로하게 해, 나가 해결책을 여기에서 발견 할 것이라는 점을 희망했다; 솔루션에 대한 감사만으로는 충분하지 않지만 tq는 사전에 충분합니다. :)
업데이트 : 나를 (초보자도 사용하지 않고) 초보자를위한 유용한 사이트 (click here)을 찾았습니다.
는이에 대한 API를 사용하지 않는 이유가 거기가? 훨씬 쉬울거야. –
DOMDocument, XPath, phpquery, simple_html_dom을 사용하십시오. regexp하지 마십시오. – DevZer0
http://docs.aws.amazon.com/AWSECommerceService/latest/DG/TopSellers.html :) –