2013-07-10 2 views
0

HTML 텍스트 표현식에서 키워드를 캡처하는 데 가장 규칙적으로 최적화 된 것이 무엇인지 알고 싶습니다. PHP를 사용하고 있습니다.HTML 태그의 단어 캡처

이 같은 HTML 코드의 조각을 가지고

... 
<li><span class="fl"> 
Dish</span> 
<div class="oflow"> 
<span class="1F4446484E1FCB4FC3C21FC04AC6C21E232020211F underline"> 
pasta</span> 
, <span class="1F4446484E1FCB4FC3C21FC04AC6C21E23202A251F underline"> 
rice</span> 
, <span class="1F4446484E1FCB4FC3C21FC04AC6C21E2320202B1F underline"> 
potatoes</span> 
</div> 
</li> 
... 

나는 항상 같은 유일한 단어가 "접시"는 것을 알고, 가능한 요리 (파스타, 쌀, 감자)을 선택합니다 내가 복구 할 수있는 각 키워드 사이에는 항상 간격이 있습니다.

미리 감사드립니다.

+0

HTML 구문 분석기를 사용 하시겠습니까? –

+0

http://www.binarytides.com/php-tutorial-parsing-html-with-domdocument/, http://php.net/manual/en/class.domdocument.php, http : //www.php4every1. co.kr/tutorials/php-domdocument-tutorial/ – Ben

+0

은 oflow 또는 fl 클래스이며 항상 동일한 것이며 찾고있는 것에 만 사용됩니다. –

답변

0
<?php 
    var $aDishes = explode(',', strip_tags($sHtml)); 
?>