동일한 유니 코드 (표준화 됨) table의 다른 인코딩이 있습니다. 예를 들어 UTF-8 인코딩의 경우 A
corresponds to0x0041
이지만 UTF-16 인코딩의 경우 A
은 represented as0xfeff0041
입니다.유니 코드 인코딩 (UTF-8, UTF-16, 기타)은 Windows에서 유니 코드 데이터 형식으로 사용합니까?
From this brilliant article 나는 C++ for Windows 플랫폼에서 프로그래밍 할 때 Unicode를 처리 할 때 2 바이트로 표시된다는 것을 알아야한다는 것을 알게되었습니다. 그러나 그것은 인코딩에 대해 아무 말도하지 않습니다. (심지어 x86 CPU는 리틀 엔디안이기 때문에 두 바이트가 메모리에 저장되는 방법을 알고 있습니다.) 그러나 유니 코드의 인코딩도 알고 있어야 심볼이 메모리에 저장되는 방법에 대한 완전한 정보를 얻을 수 있습니다. C++/Windows 프로그래머를위한 고정 유니 코드 인코딩이 있습니까?
'A'는 ** UTF-16에서 '0xfeff0041'로 표시되지 않습니다 **. 그것은 UTF-8에서는'0x41'이고, UTF-16에서는'0x0041'입니다. –
http://www.fileformat.info/info/charset/UTF-16/list.htm 여기에서 이미 언급 한 것처럼 내 정보의 출처입니다. 어떻게 저장 되나요? – Narek
소스가 잘못되었습니다. 이 값들은 모두 앞에 feff가 있어서는 안됩니다. '0xFEFF'는 UTF-16 BOM으로 사용됩니다. –