2012-07-01 4 views
0

jsoup를 사용하여 데이터를 웹 사이트에서 긁어 내려고했습니다. 그러나 일부 텍스트를 가져 오는 데 문제가 있습니다.jsoup 요소 선택

Document doc = Jsoup.connect(url).get(); 
doc.select("p.time").text()); 

하지만 HTML의 다음 비트는 다음과 같습니다 :

<p class="date"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p> 
html로의

일부는 내가 코드의 줄을 사용하여 잘 잡아 수있는이

<p class="time">9:00</p> 

처럼 보인다

나는 어떻게해야할지 모르겠다. 다음 줄 사용 :

doc.select("p.date").text()); 

그냥 빈 문자열을 가져옵니다. 나는 그 변형 (즉, "p.date"를 선택한 다음 date.select ("strong")을 시도)를 시도했지만 빈 문자열을 계속 사용하고 있습니다.

날짜 텍스트를 가져 오는 방법은 무엇입니까?

+0

, '예.? 또는'doc.select ("p.date strong"). text();' – Daniel

답변

1

문제를 재현 할 수 없습니다.

Document doc = Jsoup.parse("<html><body><p class=\"date\"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p></body></html>"); 
String s = doc.select("p.date").text(); 
System.out.println(s); 

이 인쇄 : "금요일 27 2012 7월"어떻게`doc.select ("p.date") 아동 (0)는 .text()에 대한