웹에서 가져온 콘텐츠를 구문 분석해야하며 특수 문자가 포함될 수 있습니다. contet 위 org.xml.sax.helpers.DefaultHandler에서 확장 된 클래스, 메소드 문자()에 전달인코딩 문제
<?xml version="1.0" encoding="UTF-8"?>
<products>
<product>
<id>1</id>
<price>2.14</price>
<title>test ž test</title>
:
이 경우 내용 문자열은 다음과 같이 나타납니다public class ProductsXMLHandler extends DefaultHandler {
...
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
String elementValue = new String(ch, start, length);
...
}
난 test ž test
세 개의 어레이로 분할되는 배열을 발견 '시험', 'ž
'및 '검사' 때문에 elementValue 결과가 있어야하는 test ž test
동일하지 않다. 누구든지 문제를 해결하는 방법을 알고 있습니까? 이 XML 핸들러 클래스에 전달되기 전에
<?xml version="1.0" encoding="UTF-8"?>
<products>
<product>
<id>1</id>
<price>2.14</price>
<title>test ž test</title>
:
가 소스 문자열을 코딩 할 필요가 있습니까?
감사합니다.