xml 파일의 이름이 wrong.xml과 good.xml 인 사람이 분명히 있습니다.XML (SAX)을 구문 분석하기 전에 첫 번째 문자를 삭제하십시오.
<?xml version="1.0" encoding="utf-16"?>
<tag>
</tag>
문제는 wrong.xml을 구문 분석 할 때의 XMLReader 클래스 (org.xml.sax.XMLReader)는 다음과 오류를 감지한다는 것입니다 :
코드는 다음과입니다.
Content is not allowed in prolog
이유는 프롤로그 앞에 숨겨진 문자가 있기 때문입니다.
나는이 문자들을 기본 자바 파일 판독기를 사용해서 만 보았고 첫 번째 문자와 두 번째 문자가 -1과 -2라는 것을 알 수 있었다.
'-1''-2'<?xml version>......
메모장이나 UltraEdit32, 워드 패드, 메모장 ++ 등 어느 쪽을 볼 수 있습니다.
내 진짜 문제는 FTP에서 자동으로 XML을 읽어야한다는 것입니다. 그런 다음 일부 문서가 크기가 커서 모든 문서를 구문 분석하지 않고 xmlReader로 구문 분석하기 전에 이러한 문자를 삭제할 방법이 필요합니다.
파일의 첫 번째 문자는 어떻게 삭제합니까?