안녕하세요, 저는 날짜를 추출하려고하는 문서를 가지고 있습니다. 하지만 문제는 노드 내에서 날짜와 함께 일부 텍스트이기도합니다. 뭔가 같은xpath help substring expression
<div class="postHeader">
Posted on
July 20, 2009 9:22 PM PDT
</div>
이 태그에서 나는 단지 날짜 항목을 게시 할 텍스트 싶지 않아요.
./xhtml:div[@class = 'postHeader'] 이 모든 것을 얻고 있습니다. 그리고 정확하게, 내가 가지고있는 문서는 기본적으로이 요소의 노드리스트입니다. 예를 들어 다른 날짜 값으로이 요소의 노드를 10 개씩 얻지 만 문제가 언젠가는 이러한 태그 내부에 있습니다. 임의의 다른 태그도 앵커처럼 나타납니다. 등 div 태그의 날짜를 얻을 보편적 인 expath 쓸 수 있습니까?
그래서 모든 postHeader 내부 텍스트 노드가 완전히 다를 수 있습니까? – Oded
그래도 미세하지만. 그들은 추가로 '' 태그 또는'
' 태그를 가질 수 있습니다. 그러나 모든 postHeader에는 확실한 날짜가 있습니다 –