2014-02-21 3 views
0

어떻게이 뉴스의 "더 많은 부분을 읽어 낼 수 있습니까?"라는 질문을 할 수 있습니다. jsoup를 사용하면 "더 읽기"부분의 내용 만 제공됩니다. 해당 뉴스의 전체 내용을 추출하려고합니다.링크의 서브 컨텐트 추출

Scanner sc=new Scanner(System.in); 
String code=sc.nextLine(); 
doc = Jsoup.connect("http://ieee-link.org/category/events/" +code+ "/").get(); 
Elements els = doc.select("div.entry"); 
System.out.println(els.text()); 

답변

0

자세히 읽는다면 링크가있는 것 같습니다. 당신은 Jsoup으로도이 URL을 링크의 대상을 추출하여 얻을 수 있습니다 :

Elements els = doc.select("div.entry"); 
//inside each els we can find something like: <a class="more-link" href="http://ieee-link.org/renesas/">Read More »</a> 

for (Element el : els){ 
    Element anchor = el.select("a.more-link"); 
    if (anchor != null){ 
    Document moreDoc = Jsoup.connect(anchor.attr("href")).get(); 
    System.out.println(moreDoc); 
    } 
    else{ 
    System.out.println(el); 
    } 
} 

참고,이 코드는 내 머리에서 작성된다. 일부 메소드 이름이 잘못되었을 수 있습니다. 철자법 또한 의문의 여지가 있습니다.

관련 문제