documentbuilder를 사용하여 아래 내용을 구문 분석하려고합니다.xml java를 구문 분석하는 중 예외가 발생했습니다.
<html>
<head>
<meta charset="utf-8" />
<title>Test</title>
</head>
<body>
<img height="" src="google.gif?<>" />
</body>
</html>
src에는 <을 포함 할 수 없으므로 구문 분석 중에 예외가 발생합니다. xsl을 적용 할 때이를 구문 분석해야합니다. 할 방법이 있습니까? 지금은 문서 작성기를 사용하여 구문 분석을 취소하고 다시 이스케이프 처리합니다.
위의 xml을 데이터베이스에서 String 형식으로 가져옵니다. 이제 documentbuilder를 사용하여 파싱을 시도 할 때 src에 <을 포함 할 수 없다는 예외가 발생합니다. StringEscapeUtils.EscapeHTML을 사용하여 이스케이프 처리를 시도했지만 전체 문자열을 eascaping하고 다시 documentBuildet을 파싱 할 수 없습니다. HTml에서 src를 파싱하는 방법을 알려 주시길 바랍니다. -
이 XML 인코딩 [링크] (http://stackoverflow.com/questions/7818928/how-to-encode-symbols-in-xml) – Karthik
XML 파서에 도움이 될 것입니다 거기에 XML을 구문 분석 할 수 있습니다. 이 입력은 XML이 아닙니다. 당신은 그것을 고쳐야 할 것입니다. –