2013-04-18 1 views
1

이 문제에 대한 다른 게시물을 보았지만 codepoint가 2 바이트 (Windows에서) wchar_t를 두 개 이상 사용하는 경우 프로그램 방식을 결정하는 방법에 대한 세부 정보를 찾을 수 없었습니다.wchar_t에 대리 (UTF-16)가 있는지 확인하는 방법은 무엇입니까?

예 : 나는 캐릭터가 길이가시기를 결정하는 방법을 알고 싶습니다

const wchar_t* s2 = L"\U0002008A"; // The "Han" character 
std::wstring in(s2);    // length() == 2 

()> 1.

+0

UTF-16 인코딩 (Google to easy)에 따라 적절한 범위를 확인하십시오. 당신은 더 정교한 것을 찾을 수 없을 것입니다. –

답변

4
U + FFFF 위의 모든 코드 포인트는 UTF에서 서로 게이트를 사용

-16 인코딩. 대리 값은 D800-DFFF 범위 내에 있습니다.

+0

대단히 감사합니다. 그것은 대접을 작동합니다! – user2295995

관련 문제