2012-05-30 2 views
0

저는 지금 당분간 해왔 던 프로젝트에 대한 연구를 계속하고 있으며, 웹 사이트에서 데이터를 가져 오려고 애 쓰고 있습니다. 웹 사이트에는 알 수없는 출처의 일부 데이터를 가져 오는 iframe이 있습니다. 데이터는이 같은 태그 무언가의 iframe에이다가 그 위에 다른 쓰레기의 무리지만,이 사업부 아이디/라벨이 완전히 고유하며 코드에서 다른 곳에서는 사용하지java를 사용하여 html 페이지에서 단일 값을 추출하십시오.

<DIV id="number_forecast"><LABEL id="lblDay">9,000</LABEL></DIV> 

.

답변

2

jsoup은 아마도 원하는 것일 수 있습니다. HTML 문서에서 데이터를 추출하는 데 탁월합니다. http://jsoup.org/cookbook/extracting-data/selector-syntax

과정은 두 단계에있을 것입니다 :

API를 사용하는 방법을 보여주는 가능한 많은 예제가 있습니다

  • 페이지를 구문 분석하고
  • 구문 분석은 iframe의 URL을 찾을 수는 iframe의 콘텐츠 및 필요한 정보 추출

코드는 다음과 같습니다.

// let's find the iframe 
Document document = Jsoup.parse(inputstream, "iso-8859-1", url); 
Elements elements = document.select("iframe"); 
Element iframe = elements.first(); 

// now load the iframe 
URL iframeUrl = new URL(iframe.absUrl("src")); 
document = Jsoup.parse(iframeUrl, 15000); 

// extract the div 
Element div = document.getElementById("number_forecast"); 
0

당신의 자신의 url에 iframe의 iframe 변경 소스가 포함 된 페이지입니다. 이 url은 ouw 컨트롤러로 처리되고, 내용을 읽고, 구문 분석하고, 필요한 내용을 추출하고 응답에 작성합니다. iframe에 절대 참조가 있으면이 방법이 효과적입니다.

관련 문제