2016-12-14 6 views
0

중국어 텍스트가 포함 된 HTML 파일이 있습니다. 웹 브라우저에서 파일을 열면 누락 된 문자가 나타납니다. 여기 웹 브라우저에서 중국어 문자 인코딩이 누락되었습니다.

브라우저 창에서 복사 한 예입니다 :

本 函 旨在 邀請 您 參 定 於

나는 다른 모든 문자는 여기에서 보이는 누락 된 것을 제외하고 올바른 있다는 사실을 알고 (원어민 화자가 확인). 는 HTML 헤더에서

, 나는 파일을 의미하는 태그는 UTF-8 인코딩 된 문자가 포함되어 있습니다

<META http-equiv="Content-Type" content="text/html; charset=utf-8"> 

가 이미이 META 태그에 다른 문자 집합을 시도했습니다,하지만 지금까지 어느 것 인코딩 방법 나는 UTF-8을 제외하고는 더 악화되어 보인다.

글꼴 문제 일 가능성도 고려 했으므로 시스템에 3 가지 다른 중국어 글꼴을 설치하고 Chrome에서 강제로 사용하도록했습니다. 그들 중 누구도 아무런 차이가 없었습니다. 실종 된 인물이 여전히있었습니다. 나는 ++ 메모장에서 HTML 파일을 열면

, 여기 내가 볼 수있는 작업은 다음과 같습니다

:

http://i.imgur.com/GoS07WX.png

내가 선택하고 일반 MS 메모장에이 텍스트를 복사하여 붙여 넣을 경우,이 얻을 메모장 ++에서 보이는 "xE5 x8A"가 replaced로 바뀌 었음을 알 수 있습니다.

이 시나리오에서 브라우저가 대신에 showing을 표시하는 이유가 있습니까?

답변

0

HTML 파일을 다시보십시오.

UTF-8로 인코딩 된 문자의 첫 번째 2 바이트 다음에  이 표시됩니다. 원래 \ xA0이 있다고 가정 해 보겠습니다.이 문자는 대체 문자를 대체하여 파일을 만들었을 때 &nbsp;으로 변경되었습니다. UTF-8로 인코딩 된 데이터

그러나 \ xE5 \ x8A xA0은 UTF-8은 U + 52A 6 인 외계 문자와 동일하지 U + 52A 0으로 디코딩 \ ... 응답 충분히 닫히지.

+0

실제로 HTML 파일을 생성하는 프로그램 내 인코딩 설정과 관련된 문제가 있었던 것 같습니다. 소스 HTML 파일이 수정되었으므로 더 이상이 문제가 발생하지 않습니다. – user2539827