2014-09-05 3 views
1

이스라엘 뉴스 사이트 (히브리어)를 구문 분석하는 뉴스 앱을 만드는 중,이 오류가 계속 발생합니다. "org.apache.harmony.xml.expatparser $ parseexception in line 1 column 17 (잘못된 토큰) " 이제 문제가 인코딩에 있음을 알았습니다 ... rss 피드의 인코딩은"Windows-1255 ", rss 피드"view-source : http://www.ynet.co.il/Integration/StoryRss2.xml " 시도했습니다 :히브리어 뉴스 사이트의 RSS 피드 구문 분석

SAXParserFactory spf = SAXParserFactory.newInstance(); 
    SAXParser sp = spf.newSAXParser(); 
    RssHandler rh = new RssHandler(); 
    input= new InputSource(new StringReader(feed)); 
    input.setEncoding("Windows-1255"); 
    sp.parse(input, rh); 

하지만 작동하지 않습니다 ... 도와주세요! 감사합니다.

답변

0

문자열에 대한 피드를 어떻게 읽었습니까? 이 오라클의 자바 (8) 내 리눅스 시스템에서 오류없이 (기본적으로 UTF8 캐릭터 세트)와 함께 작동하도록 것 때문에 XML은 아마이 부러 :

SAXParserFactory spf = SAXParserFactory.newInstance(); 
    try { 
     SAXParser sp = spf.newSAXParser(); 
     InputSource input = new InputSource(new URL("http://www.ynet.co.il/Integration/StoryRss2.xml").openStream()); 
     sp.parse(input, new DefaultHandler() { 
      @Override 
      public void startElement(String uri, String localName, String qName, 
        Attributes attributes) throws SAXException { 
       System.out.print(qName + ": "); 
      } 
      @Override 
      public void characters(char[] ch, int start, int length) throws SAXException { 
       System.out.print(new String(ch, start, length)); 
      } 
     }); 
    } catch (Exception e) { 
     e.printStackTrace(); 
    } 

"org.apache.harmony.xml.expatparser의 $의 ParseException가".. 아파치 하모니를 사용하고 있습니까? 오래된 Java 구현이므로 가능한 경우 최신 버전으로 업데이트하십시오. 나 또한 Rome을 사용하여 rss 피드를 읽는 것이 좋습니다.

관련 문제