우선, 비슷한 질문을 많이 봤습니다. regex 또는 dom 사용할 수 있지만 DOM 및 정규식 좋은 예제를 찾을 수 없다는 것을 알고 내 머리를 끌어 당긴다. 또한 html 소스에서 여러 값을 가져와야하며 일부 내용은 일부 특성을 가져와야합니다. "메시지"블록이 한 번 또는 수백 번 발생할 수 있습니다HTML에서 정보를 추출 하시겠습니까?
<div class="log">
<div class="message">
<abbr class="dt" title="time string">
DATA_1
</abbr>
:
<cite class="user">
<a class="tel" href="tel:+xxxx">
<abbr class="fn" title="DATA_2">
Me
</abbr>
</a>
</cite>
:
<q>
DATA_3
</q>
</div>
</div>
: 여기
내가로부터 정보를 얻을하는 데 필요한 HTML의 예입니다. SimpleXML을을 사용하여array(4) {
[0] => array(3) {
["time"] => "DATA_1"
["name"] => "DATA_2"
["message"] => "DATA_3"
}
[1] => array(3) {
["time"] => "DATA_1"
["name"] => "DATA_2"
["message"] => "DATA_3"
}
[2] => array(3) {
["time"] => "DATA_1"
["name"] => "DATA_2"
["message"] => "DATA_3"
}
[3] => array(3) {
["time"] => "DATA_1"
["name"] => "DATA_2"
["message"] => "DATA_3"
}
}
내가 시도했지만 매우 간단한 HTML 페이지를 작업 할 것 같다 :이 같은 데이터와 끝까지 노력하고 있어요. 누군가가 나를 몇 가지 예와 연결시킬 수 있을까? title 속성에서 DATA_2를 가져와야하므로 혼란 스럽습니다. 자신의 데이터를 추출하는 가장 좋은 방법은 무엇이라고 생각하십니까? 그것은 내가 한 XML 추출과 매우 유사하지만 다른 방법을 사용해야합니다.
추출 할 URL은 무엇입니까? –
DOM 기능을 살펴 보셨습니까? http://php.net/manual/en/book.dom.php – Robbie
데이터 추출을위한 또 다른 좋은 라이브러리는 웹 페이지를 크롤링하기 위해 이미 사용하고있는 jQuery와 비슷한 방식으로 작동하기 때문에 phpQuery입니다. – scottheckel