2016-10-18 3 views
1

Firefox는 '囧'을 gb2312로 인코딩 된 HTML로 표시 할 수 있습니다. 그러나 u'囧'.encode('gb2312')UnicodeEncodeError을 던졌습니다.u '囧'.encode ('gb2312') throws UnicodeEncodeError

1. 거기에지도가 있으므로 firefox는 해당지도에서 gb2312로 인코딩 된 문자를 찾아보고 01 표시 행렬을 찾고 을 표시 할 수 있습니다.

2. 유니 코드를 gb2312로 변환하는 데 사용할 수있는 맵이 있습니까? u'囧'은 해당 맵에 없습니까?

+0

GB2312에 있는지 확인하십시오. [이 테이블에는 없습니다] (http://ash.jp/code/cn/gb2312tbl.htm). –

+0

'囧'는 (http://www.dytt8.net/)에서 찾을 수 있으며이 페이지는 gb2312로 인코딩되어 있습니다. – user3822769

답변

3

囧 gb2312에 없습니다. 대신 gb18030을 사용하십시오. 나는 파이어 폭스가 알 수없는 문자에 직면 할 때 encode 메소드를 확장 할 수 있다고 생각한다.

2

사람들이나 소프트웨어가 GB2312로 인코딩되었다고 말하면 대부분 GBK 인코딩 인 Microsoft의 CP936으로 인코딩된다는 것을 의미합니다. GB2312는 1980 년대에 사용 된 GBK의 하위 집합 이었지만 두 가지 모두는 same family of encodings의 일부입니다.

덧붙여서 WhatWG의 encoding specification은 "gb2312"로 표시된 모든 텍스트를 GBK 인코딩 된 텍스트로 취급하도록 권장합니다.

따라서 u'囧'.encode('gbk') 또는 u'囧'.encode('cp936') 또는 u'囧'.encode('windows-936')을 시도하십시오.

관련 문제