2014-03-12 5 views
1

wiki에서 목차를 고칠 때 문제가 있습니다. 개인 프로젝트를위한 간단한 웹 스크레이퍼를 만들고 있는데이 데이터를 어떻게 긁을 수 있는지 알 수 없습니다. 여기 목차 위키 스크레이퍼 목차 상자를 얻는 방법

난 그냥 단어 "연대기"를받을 수 있나요 어떻게 긁어 할 페이지,에서 코드 특정 위키 페이지 여기

String contentOver = doc.select("#toclimit-3 > li").first().text(); 

에서 목차를 긁어에서 내 시도이다?

<ul> 
    <li class="toclevel-1 tocsection-1"><a href="#Chronology"><span class="tocnumber">1</span> <span class="toctext">Chronology</span></a></li> 
+0

doc.select 첫 번째() 텍스트(); ("toctext을.").. // <<<이 작품 덕분에 alecxe – StreamingBits

답변

1

당신은 클래스 이름을 얻을 수 있습니다 :

Element li = doc.select("#toclimit-3 > li").first(); 
String result = li.select(".toctext").first().text(); 
+0

그래서 나는 NUllpointer 예외가있어. 왜 그런가요? – StreamingBits

+0

@StreamingBits이'doc.select (".toctext"). 그냥 시도해 주시겠습니까? first(). text();'? – alecxe

+0

그 작품! 어떻게 계속하고 다음을 얻을 수 있습니까? – StreamingBits