Windows의 유니 코드 UTF-8 인 MSVC 10에서 코딩해야합니다. UTF-8로 인코딩 된 문자열은 문자 당 1 또는 2 바이트를 사용한다는 것을 알고 있습니다. 그래서, 내 질문은 : std :: string 적합한이 있습니까? 그렇다면 문자열을 어떻게 해독합니까? 늘어나는만큼 내가 이해 표준 : : 문자열은 단지 바이트의 배열이며 어떤 디코딩 로직을 제공하지 않습니다. 문자열의 논리적 길이를 어떻게 알 수 있습니까? 문자열에서 논리적 문자를 추출하려면 어떻게해야합니까? 문자열에서 논리 문자를 추출하는 데 도움이되는 라이브러리가 있습니까?UTF-8 디코딩 라이브러리
예 : 나는 문자열 "올레"표준에 : : 문자열이있는 경우, 나는 길이가 3 인 것을 알 필요가 있지만 4
UTF-8은 하나 또는 두 개가 아닌 문자 당 최대 4 바이트까지 사용할 수 있습니다. – deceze
문자열을 디코딩하면 [정확히] (http://utf8everywhere.org/#faq.glossary) 무엇을 의미합니까? 더 중요한 것은 왜 길이를 알아야합니까? 일반적으로 유니 코드에서는 의미가 없습니다. – ybungalobill