2011-08-15 6 views
3

자바 및 Jsoup를 사용하여 HTML 페이지를 구문 분석하고 포함 된 텍스트를 인쇄하기 위해 다른 div가 포함되지 않은 div를 모두 가져 오려고합니다.그 안에 다른 div가없는 div 요소를 어떻게 선택합니까?

하지만 예를 들어, div에 표가 있고 표에 costdb가 있으면 원하는 것은 아닙니다. 나는 가장 밑바닥 수준에 div 만 있고, 다른 div는 그 안쪽에있다 (다른 꼬리표는 좋다).

어떻게하면됩니까?

Primarilly, select() 메서드와 함께 사용할 수있는 구문이 있는지 알고 싶습니다.

+0

정규식을 사용합니다. http://php.net/manual/en/function.preg-match.php – RSM

답변

1
Document doc; //comes as parameter 

Elements divs = doc.getElementsByTag("div"); 
for(Element div: divs){ 
    if(div.getElementsByTag("div").size() == 1){ 
     //is a div with no divs inside it 
    } 
} 
관련 문제