웹 페이지의 색인을 생성하고 있습니다. 이 코드는 웹 페이지의 링크와 주어진 제목의 웹 페이지를 검색합니다. 링크와 제목은 두 개의 다른 배열에 저장됩니다. 배열이라는 단어와 링크가 이어지는 다차원 배열을 만들고 링크의 개별 제목을 작성하고 싶습니다. 나는 코드를 가지고있다. 나는 그것을 모으는 법을 모른다.두 배열로 다차원 배열 만들기
require_once('simplehtmldom_1_5/simple_html_dom.php');
require_once('url_to_absolute/url_to_absolute.php');
//links
$links = Array();
$URL = 'http://www.youtube.com'; // change it for urls to grab
// grabs the urls from URL
$file = file_get_html($URL);
foreach ($file->find('a') as $theelement) {
$links[] = url_to_absolute($URL, $theelement->href);
}
print_r($links);
//titles
$titles = Array();
$str = file_get_contents($URL);
$titles[] = preg_match_all("/\<title\>(.*)\<\/title\>/", $str, $title);
print_r($title[1]);
당신은 출력이 기대했던 것과의 예를 들어 주실 수 있습니까? –
스크래핑하는 HTML은 어떤 모습입니까? 당신의 방법론은 DOM 파서를 사용하여 ''태그를 검색 한 다음 별도로 ''을 검색하는 정규식을 사용하지 않는 것으로 보입니다. 그리고 출력물이 어떻게 생겼는지 예제를 게시하십시오. –
예, 출력으로 원하는 것을 게시하십시오. 진심으로, 귀하의 현재 설명은 이해할 수 없습니다. –