2012-06-13 3 views
0

그래서이 웹 사이트 http://www.engin.umich.edu/htbin/wwwhostinfo?detail=0&display=all&sort=open의 테이블에 액세스하여이를 Elements 개체로 만들려고합니다. 나는 첫 번째와 네 번째 기둥 만 필요합니다. 그래서 저는 jsoup를 사용하고 있습니다 :jsoup에서 html을 제거하고 html 테이블 콘텐츠 만 추출하는 방법은 무엇입니까?

Document doc = Jsoup.connect("http://www.engin.umich.edu/htbin/wwwhostinfo?detail=0&display=all&sort=open").get(); 
     Elements buildings = doc.select("td:eq(0),td:eq(3)"); 

이것은 첫 번째와 네 번째 열을 선택해야합니다. 그 일을하고 있지만 모든 HTML 데이터도 마찬가지입니다. "다음 보고서 ..."웹 페이지의 모든 초기 내용을 건너 뛰고 싶습니다. 빌딩과 오픈이라는 두 개의 열이 필요하기 때문에 추가 변수를 초기화하고 건물의 열린 컴퓨터 수를 할당하고 마지막으로 Toast 나 유사한 것을 사용하여 건물의 열린 컴퓨터 수를 표시 할 수 있습니다. 화면.

현재 TextView를 사용하여 데이터를 보여 주며, 원하지 않는 모든 html 데이터를 보여줍니다.

TextView tv = new TextView(this); 
     tv.setText(""+buildings); 
     setContentView(tv); 

수 개별 값을 요소에서 추출 할 수 있습니까?

간단히 말해서 : 다른 모든 데이터를 건너 뛰고 자신의 변수에 할당하여 건물 이름과 열린 컴퓨터 수를 추출하는 방법은 무엇입니까?

이 작업을 수행하는 방법에 대한 아이디어가 있으십니까?.

감사의 말 - a.v.

+0

당신은 웹 스크랩에 대해 알고 있습니까? –

답변

0

해당 작업에 JSOUP Cleaner & Whitelist을 사용할 수 있습니다.

제거하지 말아야 할 것을 정의하고 나면 좋습니다!

+0

감사합니다. 이것은 그것을 정말로 빨리 끝내었다! – avtri

관련 문제