XML 파일을 구문 분석하려고했지만 "2 바이트 UTF-8 시퀀스의 유효하지 않은 바이트 2가 있습니다. 아무도이 문제의 원인을 알지 못합니까? ? 감사합니다.2 바이트 UTF-8 시퀀스의 바이트 2가 유효하지 않습니다.
답변
하나 파서는이 때문에 가장 일반적으로 UTF-8 파일을 다른 인코딩이나 파일이 UTF-8을 사용으로 선언하지만 정말하지 않더라도.
설정되어과 같이 특정 라틴어 -1 문자 (액센트 또는 움라우트가있는 두 개의 연속 문자)가 무효 한 형식을 이루고 있으며 특히 다음과 같은 내용을 기반으로합니다 : ISO-8859-x
(Latin-x, Latin-1과 유사) 처음으로 b yte, 두 번째 바이트에 예기치 않은 상위 비트가 있습니다. 일부 프로세스는 라틴어-1을 사용하여 XML
을 덤프 때
이
쉽게 발생할 수 있지만, 출력XML
선언 중 하나를 잊어은 (이 경우
XML
파서는
XML
사양에 따라,
UTF-8
를 기본값으로해야한다), 또는 심지어 때를
UTF-8
을의 주장 그렇지 않습니다.
수정 방법에 대한 제안 사항이 있으십니까? 타사 라이브러리 XMLTask를 사용하여 개미 작업을 정의 할 때이 문제가 발생했습니다. – AgentKnopf
그때 힘들다; 그렇지 않으면 일반적으로 특정 인코딩을위한 InputStreamReader를 명시 적으로 작성한 다음이를 XML 파서에 제공합니다. 하지만 Ant와 함께 할 일이 무엇인지 확신 할 수 없습니다. 가능한 경우 XML 파일 자체를 수정하는 것 말고는 물론입니다. – StaxMan
문제를 알아 냈습니다. xml 파일을 다른 형식으로 변환 할 때 xml 파일 중 하나에서 Umlaut (ä, ö, ü)가 어떻게 든 엉망이되었습니다. 내가 그 Umlaut를 제거하고 나면 효과가있었습니다. – AgentKnopf
String.getBytes()에서 사용하는 기본 문자 인코딩을 utf-8로 변경할 수 있습니다. VM 옵션 -Dfile.encoding = utf-8을 사용하십시오.
나는 동일한 문제가있었습니다. 내 문제는 jdom과 FileWriter (xmlFile)을 사용하여 새 XML 파일을 만들었다는 것입니다. FileWriter는 UTF-8 파일을 만들 수 없습니다. 대신 FileOutputStream (xmlFile)을 사용하여 해결했습니다.
여전히 실수를하는 사람들에게. UTF-8은 그래서 어떤 라틴어 문자 나에 대한 귀하의 XML 문서를 체크 아웃 사용하기 때문에
: 내가이 가진 문제점과 같은 이유는 내가이 있었다 :
<n:name>Åke Jógvan Øyvind</n:name>
희망이
내 Java 도구로 .xml 파일을 가져올 때도 동일한 문제가 발생했습니다. 그리고 이것에 대한 좋은 해결책을 찾았습니다. 1. Notepad ++로 .xml 파일을 연 다음 .xml 파일을 .rtf 파일로 저장하십시오. 그런 다음 워드 패드 응용 프로그램에서이 파일을 엽니 다. 2. .rtf 파일을 .txt 파일로 저장 한 다음 메모장에서 열고 .xml 파일로 다시 저장하십시오. 메모장에 저장할 때 팝업 창의 끝 부분에 "인코딩 : UTF-8"옵션을 선택해야합니다. 그것은 내 작품, 희망도 당신을 위해 유용합니다.
- 1. "1 바이트 UTF-8 시퀀스의 잘못된 바이트 1"오류
- 2. ImageConverter : 매개 변수가 바이트 배열에 유효하지 않습니다.
- 3. 2 바이트 문자 또는 1 바이트 문자
- 4. 잘못된 UTF8 바이트 시퀀스에 문제가 있습니다.
- 5. 2 바이트 표현 2,008
- 6. PostgreSQL + PHP + UTF8 = 인코딩을위한 바이트 시퀀스가 올바르지 않습니다.
- 7. 자바 : 바이트 []에서 바이트 []
- 8. 이진 파일의 2 바이트 정수
- 9. 2 바이트 씩 HMACSHA1 해제
- 10. PHP 수정 이미지 바이트 바이트
- 11. 왜이 바이트 코드를 확인하지 않습니다
- 12. GCC에 2 바이트 (UCS-2) 와이드 문자열
- 13. MD5는 4 바이트 및 8 바이트 키를 16 바이트 값으로 해시합니다. 충돌의 기회는 무엇입니까?
- 14. getResponseBodyAsStream는 "1 바이트 UTF-8 시퀀스의 잘못된 바이트 1"을 반환
- 15. C# 캐스트 바이트 [*, *, *]를 바이트 []
- 16. 바이트 검색 [
- 17. 바이트 배열에서 UTF8로 CString
- 18. 'utf-8'은 0 바이트 위치 0xc0을 디코딩 할 수 없습니다. 유효하지 않은 시작 바이트
- 19. Java : 바이트 배열을 바이트 배열로 변환
- 20. C#에서 구조체의 바이트 직렬화에 대한 바이트
- 21. 어떻게 cp1251 바이트 배열을 utf8 문자열로 변환 할 수 있습니까?
- 22. 삽입시 Postgres 오류 - 오류 : "UTF8"인코딩의 바이트 시퀀스가 잘못되었습니다 : 0x00
- 23. node.js의 바이트 스트림 처리
- 24. SQL Server 2008에서 2 바이트 문자 검색
- 25. 정수를 2 바이트 바이너리로 분할하는 방법은 무엇입니까?
- 26. int 바이트 스트림을 float 바이트 스트림으로 변환합니다.
- 27. 바이트 x에서 바이트 y까지의 Java readFile
- 28. 어셈블리 코드 저장 바이트 /로드 바이트
- 29. 파일은 0 바이트 (0 바이트)로 저장됩니다.
- 30. VB.NET의 바이트 배열에서 4 바이트 가져 오기
어떻게 XML 파일을 구문 분석합니까? – jtahlborn