2011-08-15 3 views
1

내가 정규식과 simplehtmldom 사용하여이 페이지에서 기사의 제목을 얻으려면이 경우 제목에 http://laperuanavegana.wordpress.com/about/regex를 사용하여 기사의 제목을 얻는 방법은 무엇입니까?

것은 : 코모 preparar 시탄 여기

내 정규식 :

$html = file_get_html($url); 
preg_match_all("title=(.*?)",$html->innertext,$title); 
echo "this is title ".$title[0][0]."<br>"; 

이 누군가가 내가 버그를 찾는데 도움이된다면 도움이 될 것입니다.

+1

(http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml- [당신은 정규식 HTML을 구문 분석을 시도해서는 안] 자체 포함 태그/1732454 # 1732454) – Bohemian

답변

2

<title></title> 사이의 텍스트를 찾고, 다음 텍스트가 아닌 title=을 찾아야한다고 생각합니다. 예를 들어

:

$html = "Sometext<title>Seitan</title>More text"; 
preg_match_all('|<title>(.*?)</title>|',$html,$title); 
echo "this is title ".$title[1][0]."<br>"; 
관련 문제