그래서이 웹 사이트 http://www.engin.umich.edu/htbin/wwwhostinfo?detail=0&display=all&sort=open의 테이블에 액세스하여이를 Elements 개체로 만들려고합니다. 나는 첫 번째와 네 번째 기둥 만 필요합니다. 그래서 저는 jsoup를 사용하고 있습니다 :jsoup에서 html을 제거하고 html 테이블 콘텐츠 만 추출하는 방법은 무엇입니까?
Document doc = Jsoup.connect("http://www.engin.umich.edu/htbin/wwwhostinfo?detail=0&display=all&sort=open").get();
Elements buildings = doc.select("td:eq(0),td:eq(3)");
이것은 첫 번째와 네 번째 열을 선택해야합니다. 그 일을하고 있지만 모든 HTML 데이터도 마찬가지입니다. "다음 보고서 ..."웹 페이지의 모든 초기 내용을 건너 뛰고 싶습니다. 빌딩과 오픈이라는 두 개의 열이 필요하기 때문에 추가 변수를 초기화하고 건물의 열린 컴퓨터 수를 할당하고 마지막으로 Toast 나 유사한 것을 사용하여 건물의 열린 컴퓨터 수를 표시 할 수 있습니다. 화면.
현재 TextView를 사용하여 데이터를 보여 주며, 원하지 않는 모든 html 데이터를 보여줍니다.
TextView tv = new TextView(this);
tv.setText(""+buildings);
setContentView(tv);
수 개별 값을 요소에서 추출 할 수 있습니까?
간단히 말해서 : 다른 모든 데이터를 건너 뛰고 자신의 변수에 할당하여 건물 이름과 열린 컴퓨터 수를 추출하는 방법은 무엇입니까?
이 작업을 수행하는 방법에 대한 아이디어가 있으십니까?.
감사의 말 - a.v.
당신은 웹 스크랩에 대해 알고 있습니까? –