2012-06-20 5 views
-2

가능한 중복 :
How to parse and process HTML with PHP?HTML을 정규식으로 구문 분석하는 방법은 무엇입니까?

나는 다음과 같은 형식으로 많은 레코드가 들어 HTML 문서가 있습니다

<tr><td>af</td><td>Afrikaans</td></tr> 

말해, 어떻게 추출 할 수 있습니다하세요 "AF를 "및"아프리칸스어 "는 정규 표현식을 사용합니까? 고맙습니다.

+1

예를 들어 simplexml을 사용하지 마십시오. – k102

+0

은 XML이 아니며 HTML – dynamic

+5

입니다. [일부 사람들은 세상이 뜨거워 지길 원합니다.] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454 # 1732454) – BoltClock

답변

1

이것은 당신이 시작하는 간단한 예는 단지이지만, HTML의 구조에 따라 일부 개조하면 되겠 확인해야합니다 : 또한

$s = <<<EOM 
<tr><td>af</td><td>Afrikaans</td></tr> 
EOM; 

$d = new DOMDocument; 
$d->loadHTML($s); 
foreach ($d->getElementsByTagName('td') as $node) { 
    echo $node->nodeValue; 
} 

참조의 DOMDocument 문서

+0

당신은 그 사람입니다, 고마워요. – user1445877

0

당신이해야 XML을 파싱하기위한 정규식 대신 DOM, SAX, SimpleXML, PHPQuesry, tidy를 사용하십시오.

관련 문제