가 나는이 두 가지 구조가, HTML 코드에서 일부 정보를 추출해야합니다HTML을 추출 정보
<p>Street 1a</p>
<p>12345 Berlin</p>
내 질문은 문자열을 추출하는 방법이다
<p>
Street 1a
<br>
12345 Berlin
</p>
을 '거리 1A '하나의 방법으로 두 구조에서.
나는 모든 가능한 html-sturcure에 대해 메소드를 작성하는 것에 대해 생각했지만, 이것은 많은 작업이 필요합니다. 는 또한 전체 HTML 코드를 분석하고 패턴 매칭을 할 생각하지만 처럼, 매우 우아한되지 않습니다 :
$xml = new DOMDocument();
libxml_use_internal_errors(true);
// Load the url's contents into the DOM
$xml->loadHTMLFile($url);
libxml_clear_errors();
// pattern matching now
누구나이 약간의 경험이있다?
안녕하세요. 감사합니다.
가능한 중복을 좋아한다 스크립트 (http://stackoverflow.com/questions/7324620/domdocument-for-parsing -html-instead-of-regex) – ThW