컬을 사용하여 학술 연구에 대한 인기 뉴스 사이트의 의견을 긁어 내려고하고 있습니다. < 300 개의 댓글을 가진 기사에는 문제가 없지만 그 후에는 어려움을 겪습니다. 순간대형 페이지를 긁어내는 데 컬 사용
$handle = curl_init($url);
curl_setopt($handle, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($handle);
curl_close($handle);
echo $html; //just to see what's been scraped
이 페이지는 잘 작동 :하지만이 중 하나는 총 700 거기에도 불구하고 36 개 의견을 반환
http://www.guardian.co.uk/commentisfree/2012/aug/22/letter-from-india-women-drink?commentpage=all#start-of-comments : http://www.guardian.co.uk/commentisfree/2012/aug/21/everyones-talking-about-rape?commentpage=all#start-of-comments
왜의 톤과 기사 고투하고있다코멘트?
요소를 지정해야합니다 지적 체크 아웃해야합니다 [Scrapy] (http://scrapy.org/) ... –
페이지 매김이 사용됩니다. 페이지 수를 알고주기를 사용하면 각 페이지에서 의견을 얻을 수 있습니다. –