의사 XML 형식으로 제공되는 파일에서 텍스트를 구문 분석하려고합니다. 그것은 다음과 같은 구조로 오면 내가 그것에서 DOM 문서를 얻을 수 있습니다 :Java에서 의사 XML 파일 구문 분석
<product>
<product_id>234567</product_id>
<description>abc</description>
<quantity 1:2>
<version>1.1</version>
</quantity 1:2>
<version>1.2</version>
<quantity 2:2>
</quantity 2:2>
</product>
그것은 생성 구조는 다음과 유사 할 때 내가 실행 해요 문제가 발생
<product>
<product_id>234567</product_id>
<description>abc</description>
</product>
<quantity 1:2>
의 공간으로 인해 다음과 같은 예외 :
org.xml.sax.SAXParseException:[Fatal Error] :1:167: Element type " quantity " must be followed by either attribute specifications, ">" or "/>"
나는 밑줄 공간을 대체하면이 문제를 해결할 수 있습니다. 문제는 구조가 크기가 다를 수 있으며 동일한 형식 (<node 1:x>
)의 여러 하위 노드가 포함되어 있으며 파일에 구문 분석 할 수있는 구조가 수백 개 포함될 수 있다는 것입니다. 이 같은 텍스트를 파싱 할 수있는 클래스가 트리와 같은 객체를 반환합니까?
파일을 유효한 XML로 사전 처리하는 클래스를 만들었습니다. – Mane