2012-03-23 3 views
0

Android 휴대 전화에서 웹 페이지를 읽고 아래 코드 샘플을 원합니다. 그러나이 코드를 사용하면 웹 페이지의 모든 항목을 가져옵니다. 하지만 웹 페이지에서 기사를 얻고 싶습니다. 나는 HTML 태그로 그들을 얻고 싶지 않다. 웹 페이지에서 기사 만 수신하려면 어떻게해야합니까? 당신의 기사를 쿼리하는 웹 사이트 (아마도 RSS 피드의 형태로) 텍스트 전용 콘텐츠를 포함하지 않는html 태그가없는 Android 폰에서 웹 페이지 읽기

import java.net.*; 
import java.io.*; 

public class URLReader { 
    public static void main(String[] args) throws Exception { 

     URL oracle = new URL("http://www.oracle.com/"); 
     BufferedReader in = new BufferedReader(
     new InputStreamReader(oracle.openStream())); 

     String inputLine; 
     while ((inputLine = in.readLine()) != null) 
      System.out.println(inputLine); 
     in.close(); 
    } 
} 

답변

0

, 당신이 할 수있는 최선의 전체 HTML과 텍스트를 가져온 다음 밖으로 제거하려고 시도하는 것입니다 HTML 태그. 문자열 내부의 HTML을 구문 분석하는 데 필요한 완전한 증거 솔루션이 거의 없기 때문에이 방법은 신뢰할 수 없습니다.

시험해보기 : Remove HTML tags from a String

관련 문제