2014-12-30 3 views
3

jsoup를 사용하여이 웹 사이트에서 빨간색으로 표시된 정보를 추출하고 싶습니다.jsoup로 div 요소를 찾을 수 없습니다

website

이 사이트의 HTML 텍스트는 다음 그림에 의해 제공됩니다. 내가 추출하고자하는 정보는 빨간색으로 다시 표시됩니다.

html code of the website

문제는 내가 클래스 속성 "을 발견 요소"인 div 요소를 찾을 수 있다는 것입니다. 내 코드는 누군가가 나를 도울 수 있다면 정말 친절 것이

public static void main(String[] args) { 
    try { 
     Document doc = Jsoup.connect("https://bestmentor.edudip.com/webinar/Lebe-deine-Berufung-und-deine-Arbeit-ist-Liebe/89620").get();   
     Elements ereignisse = doc.select("div#rating-entries div.found-elements article.rating div.text p"); 
     //Elements ereignisse = doc.select("body div#com-edudip-main-container div#content div.bottom div.academy-sidebar div.box div.ratings-exist div#rating-entries div.found-elements");   

     System.out.println(ereignisse.size()); 
     // Selektierte Elemente ausgeben ohne HTML-Tags 
     for (Element e : ereignisse) { 

      System.out.println(e.cssSelector()); 
      System.out.println(e.text()); 
     } 
    } catch (IOException e) { 
     // TODO Auto-generated catch block 
     e.printStackTrace(); 
    } 

} 

것 같습니다.

감사합니다.

+0

)로 전환 할 수 있습니다. JSoup에서 경험 한 바에 따르면 문서에서 가져온 요소는 최상위 요소가됩니다. 따라서 원하는 div는 실제로 div # ratings-elements의 요소입니다. div 등의 요소입니다. div.com-edudip-main-container로 시작하여 선택에서 드릴 다운하면, 당신은 당신이 원하는 것을 얻을 것입니다. – Tgsmith61591

+0

답장을 보내 주셔서 감사합니다.하지만 내 코드의 다섯 번째 줄에서 주석으로 표시된 내용은 무엇입니까. – matze999

+0

내가 찾고있는 부분은 동적 콘텐츠 (페이지로드 이후에 제공되는 콘텐츠)입니다. – tokosh

답변

1

페이지로드 후에 ajax를 통해로드 된 콘텐츠를 타겟팅하는 것처럼 보입니다. Jsoup는 스크립트를 실행하지 않지만, 대신 헤드 블없는 웹 브라우저 (예 :

관련 문제