웹 페이지를 열고 페이지의 모든 아웃 바운드 링크의 href 값을 저장하도록 클래스를 만들고 있습니다. 웬일인지 처음 3 일 동안 작동 한 다음에는 어색해집니다. 다음은 내 코드입니다 :strpos 문제 : 값을 가져 오는 UBLIC
class Crawler {
var $url;
function construct($url) {
$this->url = 'http://'.$url;
$this->crawl();
}
function crawl() {
$str = file_get_contents($this->url);
$start = 0;
for($i=0; $i<10; $i++) {
$beg = strpos($str, '<a href="http://',$start)+16;
$end = strpos($str,'"',$beg);
$diff = $end - $beg;
$links[$i] = substr($str,$beg, $diff);
$start = $start + $beg;
}
print_r($links);
}
}
$crawler = new Crawler;
$crawler->construct('www.yahoo.com');
가 무시 나는이 첫 번째 (10)을 반환하고 전체 문서를하지 않을 것이다 알고 당분간 루프. 하지만이 코드를 실행하면 처음 세 가지가 작동하지만 다른 모든 값은 UBLIC입니다. 아무도 도와 줄 수 있습니까? 감사합니다
대신