2011-08-09 5 views
0

\u09A8\u09AC\u09AE과 같은 XML에서 유니 코드 문자를 읽습니다. 나는 XML의 표제에서 <?xml version="1.0" encoding="utf-8"?>을 사용했다. KXML2 파서를 사용하여 서버에서 xml을 파싱하면 모든 유니 코드 문자가 하나의 문자열이됩니다. I는 문자 배열로 변환하면 준다 같은J2ME의 특수 문자 문제

샤아 0 : \

샤아 1 : U

샤아 2 : 0

샤아 3 : 9

샤아 4 : B

숯불 5 : E

는 는

는 어떻게 유니 코드 문자를 얻을 수 있습니다 뒤로?

답변

1

XML에서 \u09A8이 아니고 인 XML의 유니 코드 문자 참조!

\u을 유니 코드 이스케이프의 시작으로 취급하는 곳은 거의없고 자바 영역에 주로 있습니다.

XML에서 16 진수 유니 코드 이스케이프는 &#x09A8;이고 십진수는 &#2472;이됩니다. 즉

: 당신은 문자를 얻을 \, u, 0, 9, B, E 다시는 XML이을 포함 무엇 때문이다.

최고의 솔루션은 실제 숫자 엔티티 참조를 사용하는이 XML을 생성하는 어떤 수정하는 것입니다. 또는 \u 이스케이프를 해당 문자로 수동으로 바꿀 수 있지만 코드 만이 비표준 XML을 올바르게 해석합니다.