2010-06-05 5 views
4

ō 또는 満月 先生과 같은 특수 문자로 XML을 구문 분석하려고 할 때마다 오류가 발생합니다. xml 문서는 UTF-8 인코딩을 사용한다고 주장하지만 그럴 듯하지는 않습니다. 여기 가 귀찮은 텍스트가 나는 파이어 폭스에서 XML 볼 때 모습입니다 :특수 문자로 XML을 구문 분석하는 방법은 무엇입니까?

블리치 : 다이아몬드 더스트 반란 - M Å Hitotsu 더 숨바꼭질 Å rinmaru; 없다 블리치 - DiamondDust 반란 - MOU 체결 Hitotsu는 더 Hyourinmaru

실제 웹 사이트에

는 Å 실제로 문자 O입니다.

< BR/> 어느 날, 도라에몽과 친구들이 만나는 마법과 마법을 연구 (æ º æ å & ccedil ;, 교수 Mangetsu?) 교수 Mangetsu, (; & frac34; å & CURREN;? & ccedil å ­, 미요코)의 존재 등 고블린, 그리고 그의 딸 미요코 로하고 dange의 경고 메시지가 표시됩니다 &의 rous 근사; 의 별하계 & quot; 지구 & # 039; s 궤도. < BR/

그리고 다시 한 번, 실제 웹 사이트에 그 문자가 満 月 先生과 美 夜 子로 표시 < BR/> >.

실제 XML 파일은 UTF-8 인코딩을 사용하지 않는 것으로 보이는 특수 문자 이외의 다른 형식으로 올바르게 형식이 지정됩니다. NSXML에서 이러한 XML 파일을 구문 분석 할 수있는 방법이 있습니까?

+0

는 UTF-8 라틴어 1 reencoded으로 해석처럼 보인다. –

+0

앞에서 언급했듯이 실제 웹 사이트에서는 문자가 ō 및 満月 先生으로 표시되지만 XML 문서 (헤더의 UTF-8로 정의 됨)에서는 Å 및 æº æ å ç show로 표시됩니다 . Firefox가 문자를 Latin-1로 해석하거나 XML 문서를 작성한 사람들이 엉망이라고 생각하십니까? Xcode에서 NSUTF8StringEncoding을 사용하여 XML을로드하려고하면 작동하지 않습니다. NSASCIIStringEncoding 또는 NSISOLatin1StringEncoding과 같은 인코딩을 지정하면 문서를로드하지만 Å의 코드 인 Å (데이터 손실처럼 보임)을 표시합니다. – Snooze

답변

관련 문제