2010-04-27 5 views
0

안녕하세요, 나는 날짜를 추출하려고하는 문서가 있습니다. 하지만 문제는 노드 내에서 날짜와 함께 일부 텍스트이기도합니다. 이 태그에서Xpath 도움말 기능

<div class="postHeader"> 
Posted on 
July 20, 2009 9:22 PM PDT 

    </div> 

같은 뭔가 난 그냥 날짜 항목이 텍스트를 게시하지합니다. ~
./xhtml:div[@class = 'postHeader']
과 같은 것이 전부입니다. 그리고 정확하게, 내가 가지고있는 문서는 기본적으로이 요소의 노드리스트입니다. 예를 들어 다른 날짜 값으로이 요소의 노드를 10 개씩 얻지 만 문제가 언젠가는 이러한 태그 내부에 있습니다. 임의의 다른 태그도 앵커처럼 나타납니다. 등 div 태그의 날짜를 얻을 보편적 인 expath 쓸 수 있습니까?

+0

XPath를 사용하는 언어는 무엇입니까? XSL을 사용하여 변환하거나 데이터를 추출하고 있습니까? –

+0

가능한 모든 입력 형식을 예로 들어주십시오. –

+0

가능한 복제본 http://stackoverflow.com/questions/2723170/xpath-help-substring-expression –

답변

0

자바를 사용하고 있습니다. XSL을 사용하지 않고 xpath를 사용하여 추출합니다.