0
문자열을 org.w3c.dom.Element로 파싱 할 때 예외가 발생합니다. 내가 요소에 문자열을 변환하는 데 사용한문자열을 org.w3c.dom.Element로 변환하는 중에 발생하는 문제
org.xml.sax.SAXParseException; lineNumber: 1; columnNumber: 245; Invalid byte 3 of 3-byte UTF-8 sequence.
코드는 다음과 같습니다
는public Element convertStringToDoc(String xmlString) throws Exception{
org.w3c.dom.Document doc;
try {
java.io.InputStream sbis = new java.io.StringBufferInputStream(xmlString);
javax.xml.parsers.DocumentBuilderFactory b = javax.xml.parsers.DocumentBuilderFactory.newInstance();
b.setNamespaceAware(false);
doc = null;
javax.xml.parsers.DocumentBuilder db = null;
db = b.newDocumentBuilder();
doc = db.parse(sbis);
org.w3c.dom.Element e = doc.getDocumentElement();
return e;
} catch (Exception e1) {
throw e1;
} }
내 입력 문자열은 다음과 같습니다 제 생각에는
<?xml version="1.0" encoding="UTF-8"?>
<a id="ctl00_RSContent1_ResultsList_ctl00_ProductTitleLink" href="../Product/the_western_european_wear_tear_parts_market_201115?productid=TD00033-006">The Western European Wear & Tear Parts Market, 2011–15</a>
감사합니다. – pbhle