제어 할 수없는 외부 소스에서 XML 파일을 받고 있습니다. 일부 XML 파일이 손상되었습니다. 특히 파일의 끝 부분에 일부 종료 태그가 없습니다. 다음과 같이 바뀝니다.Java에서 깨진 XML 파일을 구문 분석하려면 어떻게해야합니까?
<?xml version="1.0" encoding="UTF-8" ?>
<a>
<b>
<c/>
</b>
<b>
<c/>
</a>
일치하는 닫는 태그가없는 요소는 무시하면 시스템이 정상적으로 작동한다고 생각합니다.
그런 XML 파일에서 나는 무엇을 파싱 할 수 있습니까?
문서에 대한 스키마가 있습니까? 오류에서 얼마나 쉽게 복구 할 수 있는지에 차이가있을 수 있습니다 ... – xdhmoore
다양한 방법으로 이러한 오류를 복구 할 수있는 구문 분석 기법이 있습니다. 그러나 나는 XML을 위해 무엇이 가능할 지 모른다. 그리고 당신이 그것을 스스로 개발하고 싶지는 않습니다. – babou
StAX를 사용하면 속임수를 쓰는 것처럼 보입니다 –