우리는 ASCII 문자 세트 용으로 개발 된 일련의 응용 프로그램을 보유하고 있습니다. 이제 우리는 아이슬란드에 설치하려고 시도하고 있으며, 아이슬란드 문자가 엉망이되는 문제에 직면 해 있습니다.UTF-8에 안전 한 코드는 어떻게 작성합니까?
우리는이 문제를 해결하려고 노력하고 있습니다. 궁금한 점은 : 8 비트 문자 용으로 설계된 UTF-8 데이터가 제공 될 때 올바르게 작동하는 C++ 코드를 작성하기위한 좋은 "가이드"가 있습니까? 그것?
모든 사람이 유니 코드 표준 전체를 읽을 수는 없지만 더 많은 것을 소화 할 수있는 것이 있다면 팀과 공유하고 싶습니다. 그래서 우리는이 문제에 다시 부딪치지 않습니다.
wchar_t 또는 다른 문자열 표현을 사용하도록 모든 응용 프로그램을 다시 작성하는 것은 현재로서는 불가능합니다. 또한이 응용 프로그램은 네트워크를 통해 8 비트 문자를 사용하는 서버 및 장치와 통신하므로 내부적으로 유니 코드를 사용하더라도 경계에서의 번역 문제는 여전히 남아 있습니다. 대부분이 애플리케이션은 데이터를 전달합니다. 텍스트를 다른 곳으로 복사하는 것 이외의 방식으로 텍스트를 "처리"하지 않습니다.
사용되는 운영 체제는 Windows 및 Linux입니다. std :: string과 평범한 C 문자열을 사용합니다. (그리고 디자인 결정 중 하나를 방어하기 위해 저를 요구하지 않습니다 난 그냥 혼란을 해결하기 위해 노력하고있어..) 여기
제안 된 내용의 목록입니다
- The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
- UTF-8 and Unicode FAQ for Unix/Linux
- The Unicode HOWTO
앱의 OS를 확인해 주시겠습니까? Windows 용으로 프로그래밍하고 있습니까? 당신이 대량으로 std :: string 또는 더 낮은 수준의 C 헤더를 사용하고 있습니까? –
paercebal
당신이 대답을 좋아한다면, 그것을 upvote주세요 - 인색 할 이유가 없습니다. –
단 30 분 만에, 당신은 이미 rep boost를 요구하고 있습니까? :) –