2016-08-02 2 views
1

첫 번째 헤드 라인을 가져 와서 인쇄하고 싶습니다. 지금까지 HTML을 살펴본 결과 헤드 라인을 검색하는 방법을 찾았습니다.자바 : jsoup를 사용하여 뉴스 페이지에서 헤드 라인을 추출하려면 어떻게해야합니까?

data-pb-placeholder="Write headline here" 

해당 코드는 일반적으로 내가 원하는 헤드 라인보다 우선합니다. 지금까지 나는 ...

Document doc = Jsoup.connect("http://www.washingtonpost.com").get(); 
Element headline = doc.select("headline").first(); 
System.out.println(headline); 

오직 null을 출력하고 있습니다. 내가 어떻게 의사를 검색하고 헤드 라인을 찾을 수 있는지 잘 모르겠습니다.

답변

1

헤드 라인이 모두 <div class="headline">입니다. CSS selectors을 사용하여 이들을 타겟팅하고 텍스트 노드를 추출 할 수 있습니다.

Document doc = Jsoup.connect("http://www.washingtonpost.com").get(); 

    for (Element headline : doc.select("div.headline")) 
     System.out.println(headline.text()); 
관련 문제