내가 좋아하는 몇 가지 잘못된 XML 텍스트 입력을받을XML을 탈출/정리하는 Java 라이브러리? 내가 그렇게 입력을 정리할</p> <pre><code>"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>" </code></pre> <p>얻을 :
, 유지하면서도, <처럼 그 특수 기호를 탈출>이며"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>"
유효한 태그 ("<Tag>something</Tag>
, 같은 대/소문자 포함)
아마도 xml/html 파서일까요? (파서는 필요 없지만 간단합니다."깨끗합니다. "절차)
고아 '> 문자는 문제가되지 않습니다.그러나 특정 '<'문자가 태그인지 아닌지 아닌지를 어떻게 알 수 있습니까? XML 문서가 단일 DTD 또는 XML 스키마를 따르고 있습니까? 또는 '<* * always *> 뒤에 XML에서'Name'이 아닌 숫자와 같은 것이 있습니까? – erickson
그들은 내 XML 문서가 아니며 스키마가 없습니다. 불행히도 "<"기호 뒤에 공백이나 숫자가없는 경우를 발견했습니다 ... – juanmirocks