pdf 링크를 크롤링하고 싶습니다. 하지만 내가 얻을 수있는 링크는 두 배입니다. 이중 링크 중 하나를 제거하는 방법은 무엇입니까?중복 링크 제거
<?php
<include 'simple_html_dom.php';
$url = 'http://scholar.google.com/scholar?hl=en&q=data+mining&btnG=&as_sdt=1%2C5&as_sdtp=';
$html = file_get_html($url) or die ('invalid url');
foreach($html->find('a') as $e) {
$link= $e->href;
if (preg_match('/\.pdf$/i', $link)) {
print_r($link);
}
}
?>
와우! 대단히 감사합니다! array_unique 함수가 있는지 모르겠습니다. 좋아! :) – bruine