2012-09-16 5 views
0

웹 페이지의 색인을 생성하고 있습니다. 이 코드는 웹 페이지의 링크와 주어진 제목의 웹 페이지를 검색합니다. 링크와 제목은 두 개의 다른 배열에 저장됩니다. 배열이라는 단어와 링크가 이어지는 다차원 배열을 만들고 링크의 개별 제목을 작성하고 싶습니다. 나는 코드를 가지고있다. 나는 그것을 모으는 법을 모른다.두 배열로 다차원 배열 만들기

 require_once('simplehtmldom_1_5/simple_html_dom.php'); 
require_once('url_to_absolute/url_to_absolute.php'); 
//links 
$links = Array(); 
$URL = 'http://www.youtube.com'; // change it for urls to grab 
// grabs the urls from URL 
$file = file_get_html($URL); 
foreach ($file->find('a') as $theelement) { 
    $links[] = url_to_absolute($URL, $theelement->href); 
} 
print_r($links); 
    //titles 
    $titles = Array(); 
    $str = file_get_contents($URL); 
    $titles[] = preg_match_all("/\<title\>(.*)\<\/title\>/", $str, $title); 

    print_r($title[1]); 
+1

당신은 출력이 기대했던 것과의 예를 들어 주실 수 있습니까? –

+1

스크래핑하는 HTML은 어떤 모습입니까? 당신의 방법론은 DOM 파서를 사용하여 ''태그를 검색 한 다음 별도로 ''을 검색하는 정규식을 사용하지 않는 것으로 보입니다. 그리고 출력물이 어떻게 생겼는지 예제를 게시하십시오. – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">예, 출력으로 원하는 것을 게시하십시오. 진심으로, 귀하의 현재 설명은 이해할 수 없습니다. – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="answer-title"> <span class="text-logo margin-top-sm">A</span> <h2 class="title h4">답변</h2> </div> <div class="item-description text-md markdown-body margin-bottom-40 voidso"> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">1<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>동일한 제목의 링크가 있다고 가정하면 동일한 배열 키와 일치해야합니다.</p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/12447412">출처</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2012-09-16 13:53:04</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/695408/">Wasim</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> <!-- comments --> <div class="comments"> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">위의 스크립트에 표시 할 제목이 없습니다. 그것은 내가 원하는 것을 정확히 만듭니다. 단, 자신의 제목에 대한 URL을 스캔하지 않고 제목 값으로 돌려 보내지 않는다는 것만 다릅니다. – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4319274062" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">0<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>원하는 것이 분명하지 않습니다. 여기 어쨌든</p> <p>, 나는 좀 더 조직적인 방식으로 코드를 다시 작성 것이다 방법입니다</p> <pre><code class="prettyprint-override">require_once('simplehtmldom_1_5/simple_html_dom.php'); require_once('url_to_absolute/url_to_absolute.php'); $info = array(); $urls = array( 'http://www.youtube.com', 'http://www.google.com.br' ); foreach ($urls as $url) { $str = file_get_contents($url); $html = str_get_html($str); $title = strval($html->find('title')->plaintext); $links = array(); foreach($html->find(a) as $anchor) { $links[] = url_to_absolute($url, strval($anchor->href)); } $links = array_unique($links); $info[$url] = array( 'title' => $title, 'links' => $links ); } print_r($info); </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/12447458">출처</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2012-09-16 13:59:05</span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">관련 문제</div> <ul class="relative_list"> <li> 1. <a href="http://ko.voidcc.com/question/p-xfkenzqo-hs.html" target="_blank" title="다차원 배열로 다차원 객체 만들기"> 다차원 배열로 다차원 객체 만들기 </a> </li> <li> 2. <a href="http://ko.voidcc.com/question/p-gvpacqtf-dn.html" target="_blank" title="DB에서 다차원 배열 만들기"> DB에서 다차원 배열 만들기 </a> </li> <li> 3. <a href="http://ko.voidcc.com/question/p-dehbtvbi-hv.html" target="_blank" title="PHP 다차원 배열 만들기"> PHP 다차원 배열 만들기 </a> </li> <li> 4. <a href="http://ko.voidcc.com/question/p-rcrjhkeg-ds.html" target="_blank" title="csv에서 다차원 배열 만들기"> csv에서 다차원 배열 만들기 </a> </li> <li> 5. <a href="http://ko.voidcc.com/question/p-gibugpnp-cb.html" target="_blank" title="쿼리에서 다차원 배열 만들기"> 쿼리에서 다차원 배열 만들기 </a> </li> <li> 6. <a href="http://ko.voidcc.com/question/p-wvlabkuu-cc.html" target="_blank" title="연관 다차원 배열 만들기"> 연관 다차원 배열 만들기 </a> </li> <li> 7. <a href="http://ko.voidcc.com/question/p-evlqnqbt-dy.html" target="_blank" title="데이터베이스 결과에서 다차원 배열 만들기"> 데이터베이스 결과에서 다차원 배열 만들기 </a> </li> <li> 8. <a href="http://ko.voidcc.com/question/p-btgtjoca-ku.html" target="_blank" title="자바 스크립트에서 다차원 배열 만들기"> 자바 스크립트에서 다차원 배열 만들기 </a> </li> <li> 9. <a href="http://ko.voidcc.com/question/p-wywhxmyx-gr.html" target="_blank" title="다차원 배열 두 날짜"> 다차원 배열 두 날짜 </a> </li> <li> 10. <a href="http://ko.voidcc.com/question/p-rackmkym-cg.html" target="_blank" title="유니 코드 배열로 다차원 배열 정렬"> 유니 코드 배열로 다차원 배열 정렬 </a> </li> <li> 11. <a href="http://ko.voidcc.com/question/p-hccbhfmh-kz.html" target="_blank" title="임의의 정수로 다차원 배열 만들기"> 임의의 정수로 다차원 배열 만들기 </a> </li> <li> 12. <a href="http://ko.voidcc.com/question/p-hefpdzlw-y.html" target="_blank" title="VBScript에서 다차원, 연관 배열 만들기"> VBScript에서 다차원, 연관 배열 만들기 </a> </li> <li> 13. <a href="http://ko.voidcc.com/question/p-ktsznjhn-hq.html" target="_blank" title="ANTLR 문법에서 다차원 배열 만들기"> ANTLR 문법에서 다차원 배열 만들기 </a> </li> <li> 14. <a href="http://ko.voidcc.com/question/p-boqrgqda-ch.html" target="_blank" title="루프를 통해 다차원 배열 만들기!"> 루프를 통해 다차원 배열 만들기! </a> </li> <li> 15. <a href="http://ko.voidcc.com/question/p-hmaaqaos-cq.html" target="_blank" title="jquery를 사용하여 다차원 배열 만들기"> jquery를 사용하여 다차원 배열 만들기 </a> </li> <li> 16. <a href="http://ko.voidcc.com/question/p-wleetriq-gx.html" target="_blank" title="PHP에서 배열로부터 다차원 배열 만들기"> PHP에서 배열로부터 다차원 배열 만들기 </a> </li> <li> 17. <a href="http://ko.voidcc.com/question/p-cismjilc-cm.html" target="_blank" title=""parent_id"를 기반으로 다차원 배열로 배열"> "parent_id"를 기반으로 다차원 배열로 배열 </a> </li> <li> 18. <a href="http://ko.voidcc.com/question/p-wshdjowv-gz.html" target="_blank" title="PHP 객체 속성을 사용하여 다차원 배열 만들기"> PHP 객체 속성을 사용하여 다차원 배열 만들기 </a> </li> <li> 19. <a href="http://ko.voidcc.com/question/p-qtphnssh-dz.html" target="_blank" title="다차원 배열?"> 다차원 배열? </a> </li> <li> 20. <a href="http://ko.voidcc.com/question/p-scrqakas-du.html" target="_blank" title="하나의 mysql 테이블에서 다차원 배열 만들기"> 하나의 mysql 테이블에서 다차원 배열 만들기 </a> </li> <li> 21. <a href="http://ko.voidcc.com/question/p-soxffdnf-hs.html" target="_blank" title="데이터베이스에서 가져온 데이터의 다차원 배열 만들기"> 데이터베이스에서 가져온 데이터의 다차원 배열 만들기 </a> </li> <li> 22. <a href="http://ko.voidcc.com/question/p-koofwkfr-eu.html" target="_blank" title="요소를 다차원 배열로 이동하십시오."> 요소를 다차원 배열로 이동하십시오. </a> </li> <li> 23. <a href="http://ko.voidcc.com/question/p-bcsrtzet-y.html" target="_blank" title="다차원 배열을 다른 다차원 배열로 병합"> 다차원 배열을 다른 다차원 배열로 병합 </a> </li> <li> 24. <a href="http://ko.voidcc.com/question/p-fntcvyzg-y.html" target="_blank" title="다차원 배열"> 다차원 배열 </a> </li> <li> 25. <a href="http://ko.voidcc.com/question/p-ruynaaqo-n.html" target="_blank" title="(Rails) 데이터 세트에서 다차원 해시/배열 만들기 ...?"> (Rails) 데이터 세트에서 다차원 해시/배열 만들기 ...? </a> </li> <li> 26. <a href="http://ko.voidcc.com/question/p-qinrlnwp-dn.html" target="_blank" title="PHP - 다차원 배열"> PHP - 다차원 배열 </a> </li> <li> 27. <a href="http://ko.voidcc.com/question/p-sqlmlozb-ep.html" target="_blank" title="다차원 배열"> 다차원 배열 </a> </li> <li> 28. <a href="http://ko.voidcc.com/question/p-mmegozjz-bd.html" target="_blank" title="두 배열 만들기"> 두 배열 만들기 </a> </li> <li> 29. <a href="http://ko.voidcc.com/question/p-ktgzbfci-cu.html" target="_blank" title="다차원 배열"> 다차원 배열 </a> </li> <li> 30. <a href="http://ko.voidcc.com/question/p-mupbmibv-u.html" target="_blank" title="iPhone : 다차원 배열로 가치를 얻으십시오"> iPhone : 다차원 배열로 가치를 얻으십시오 </a> </li> </ul> </div> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3534119089"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img2.voidcc.com/voidso/script/side.js?t=1652515422614"></script> <script type="text/javascript" src="http://img2.voidcc.com/voidso/plugin/highlight/highlight.pack.js"></script> <link href="http://img2.voidcc.com/voidso/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <!-- VOIDCC问答侧边栏广告 --> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3862022848" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 최근 질문 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ko.voidcc.com/question/p-ncfyrjqg-xn.html" target="_blank" title="Dagger2 및 종속 구성 요소의 한정자"> Dagger2 및 종속 구성 요소의 한정자 </a> </li> <li class="side_article_list_item"> 2. <a href="http://ko.voidcc.com/question/p-uvrhczey-xo.html" target="_blank" title="get_prep_value()는 value = None을 처리해야합니까?"> get_prep_value()는 value = None을 처리해야합니까? </a> </li> <li class="side_article_list_item"> 3. <a href="http://ko.voidcc.com/question/p-eifmvdvw-xs.html" target="_blank" title="자바에서 JTextField 내부의 일반 텍스트"> 자바에서 JTextField 내부의 일반 텍스트 </a> </li> <li class="side_article_list_item"> 4. <a href="http://ko.voidcc.com/question/p-uxfbslwy-xq.html" target="_blank" title="Acumatica 처리 화면 ARTran 사용자 정의 필드 업데이트 또한 사용자 정의 테이블 필드 업데이트 필요"> Acumatica 처리 화면 ARTran 사용자 정의 필드 업데이트 또한 사용자 정의 테이블 필드 업데이트 필요 </a> </li> <li class="side_article_list_item"> 5. <a href="http://ko.voidcc.com/question/p-zrtcudxv-xp.html" target="_blank" title="활성 사이드 바를 사용하여 콘텐트 센터를 조정하는 방법"> 활성 사이드 바를 사용하여 콘텐트 센터를 조정하는 방법 </a> </li> <li class="side_article_list_item"> 6. <a href="http://ko.voidcc.com/question/p-doomdokx-xr.html" target="_blank" title="디버그 모드에서 구조체의 큰 벡터 요소에 액세스하는 것이 왜 더 작은 구조체에 액세스하는 것보다 느린 것입니까? 나는이 코드를 실행하면"> 디버그 모드에서 구조체의 큰 벡터 요소에 액세스하는 것이 왜 더 작은 구조체에 액세스하는 것보다 느린 것입니까? 나는이 코드를 실행하면 </a> </li> <li class="side_article_list_item"> 7. <a href="http://ko.voidcc.com/question/p-rmzebhav-xm.html" target="_blank" title="WebElement에는 속성이 없습니다. w3c"> WebElement에는 속성이 없습니다. w3c </a> </li> <li class="side_article_list_item"> 8. <a href="http://ko.voidcc.com/question/p-xajikucv-xd.html" target="_blank" title="iOS 앱 스토어 제출 거리 주소가 필요합니다."> iOS 앱 스토어 제출 거리 주소가 필요합니다. </a> </li> <li class="side_article_list_item"> 9. <a href="http://ko.voidcc.com/question/p-swqvjczl-xe.html" target="_blank" title="AlertDialog를 사용하여 사용자 정의 배열 어댑터에 새 객체 추가"> AlertDialog를 사용하여 사용자 정의 배열 어댑터에 새 객체 추가 </a> </li> <li class="side_article_list_item"> 10. <a href="http://ko.voidcc.com/question/p-qpbivhta-xg.html" target="_blank" title="나는 R 커널로 사용하는 jupyter 노트북에서 Jupyter 노트북"> 나는 R 커널로 사용하는 jupyter 노트북에서 Jupyter 노트북 </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 관련 문제</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ko.voidcc.com/question/p-xfkenzqo-hs.html" target="_blank" title="다차원 배열로 다차원 객체 만들기"> 다차원 배열로 다차원 객체 만들기 </a> </li> <li class="side_article_list_item"> 2. <a href="http://ko.voidcc.com/question/p-gvpacqtf-dn.html" target="_blank" title="DB에서 다차원 배열 만들기"> DB에서 다차원 배열 만들기 </a> </li> <li class="side_article_list_item"> 3. <a href="http://ko.voidcc.com/question/p-dehbtvbi-hv.html" target="_blank" title="PHP 다차원 배열 만들기"> PHP 다차원 배열 만들기 </a> </li> <li class="side_article_list_item"> 4. <a href="http://ko.voidcc.com/question/p-rcrjhkeg-ds.html" target="_blank" title="csv에서 다차원 배열 만들기"> csv에서 다차원 배열 만들기 </a> </li> <li class="side_article_list_item"> 5. <a href="http://ko.voidcc.com/question/p-gibugpnp-cb.html" target="_blank" title="쿼리에서 다차원 배열 만들기"> 쿼리에서 다차원 배열 만들기 </a> </li> <li class="side_article_list_item"> 6. <a href="http://ko.voidcc.com/question/p-wvlabkuu-cc.html" target="_blank" title="연관 다차원 배열 만들기"> 연관 다차원 배열 만들기 </a> </li> <li class="side_article_list_item"> 7. <a href="http://ko.voidcc.com/question/p-evlqnqbt-dy.html" target="_blank" title="데이터베이스 결과에서 다차원 배열 만들기"> 데이터베이스 결과에서 다차원 배열 만들기 </a> </li> <li class="side_article_list_item"> 8. <a href="http://ko.voidcc.com/question/p-btgtjoca-ku.html" target="_blank" title="자바 스크립트에서 다차원 배열 만들기"> 자바 스크립트에서 다차원 배열 만들기 </a> </li> <li class="side_article_list_item"> 9. <a href="http://ko.voidcc.com/question/p-wywhxmyx-gr.html" target="_blank" title="다차원 배열 두 날짜"> 다차원 배열 두 날짜 </a> </li> <li class="side_article_list_item"> 10. <a href="http://ko.voidcc.com/question/p-rackmkym-cg.html" target="_blank" title="유니 코드 배열로 다차원 배열 정렬"> 유니 코드 배열로 다차원 배열 정렬 </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://ko.voidcc.com/contact">문의하기</a></li> <li>© 2020 KO.VOIDCC.COM</li> <li><a rel="nofollow" href="https://beian.miit.gov.cn/" target="_blank">沪ICP备13005482号-13</a></li> <li><script type="text/javascript" src="https://s9.cnzz.com/z_stat.php?id=1280098168&web_id=1280098168"></script></li> <li><a href="http://cn.voidcc.com/" target="_blank" title="程序问答园区">简体中文</a></li> <li><a href="http://hk.voidcc.com/" target="_blank" title="程序問答園區">繁體中文</a></li> <li><a href="http://ru.voidcc.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.voidcc.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.voidcc.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.voidcc.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.voidcc.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.voidcc.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.voidcc.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.voidcc.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.voidcc.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.voidcc.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.voidcc.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script async src="https://www.googletagmanager.com/gtag/js?id=UA-77509369-5"></script> <script> window.dataLayer = window.dataLayer || []; function gtag() { dataLayer.push(arguments); } gtag('js', new Date()); gtag('config', 'UA-77509369-5'); </script> <script> var _hmt = _hmt || []; (function () { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?67d4731349f0b00136755b80364ce381"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>