2014-12-03 3 views
0

가 나는이 두 가지 구조가, HTML 코드에서 일부 정보를 추출해야합니다HTML을 추출 정보

<p>Street 1a</p> 
<p>12345 Berlin</p> 

내 질문은 문자열을 추출하는 방법이다

<p> 
Street 1a 
<br> 
12345 Berlin 
</p> 

을 '거리 1A '하나의 방법으로 두 구조에서.

나는 모든 가능한 html-sturcure에 대해 메소드를 작성하는 것에 대해 생각했지만, 이것은 많은 작업이 필요합니다. 는 또한 전체 HTML 코드를 분석하고 패턴 매칭을 할 생각하지만 처럼, 매우 우아한되지 않습니다 :

$xml = new DOMDocument(); 
libxml_use_internal_errors(true); 

// Load the url's contents into the DOM 
$xml->loadHTMLFile($url); 
libxml_clear_errors(); 

// pattern matching now 

누구나이 약간의 경험이있다?

안녕하세요. 감사합니다.

+0

가능한 중복을 좋아한다 스크립트 (http://stackoverflow.com/questions/7324620/domdocument-for-parsing -html-instead-of-regex) – ThW

답변

-1
<div id="extract"> 
    <p>Street 1a</p> 
    <p>12345 Berlin</p> 
</div> 

[(대신 정규식의) HTML을 구문 분석있는 DOMDocument]이

$(document).ready(function() { 
    $('#extract p').each(function() { 
    console.log($(this).text()); 
}); 
}); 
+0

다른 웹 사이트를 구문 분석하기 때문에 domdocument를 사용해야합니다 ... – user3683881

+1

OP는 JavaScript가 아닌 PHP로 코드를 작성합니다. – lmazgon