2009-10-18 3 views
1

두 가지 질문이 있습니다.유니 코드 코드 포인트에서 문자 가져 오기 - C++

1 - 유니 코드 포인트가 생기고이 코드 포인트와 연관된 캐릭터를 얻으려면 어떻게해야합니까? 뭔가 같은 :

int code_point = 0xD24; 
char* chr = (char*) code_point; 

하지만 위의 코드는 예외를 throw하여 실패합니다.

2 - 코드 포인트가 파일에 저장되어 있고 코드 포인트를 문자열로 읽은 경우이를 유효한 유니 코드 문자열로 변환하려면 어떻게해야합니까?

플랫폼 독립적 인 솔루션을 찾고 있습니다. 어떤 도움이라도 좋을 것입니다!

+0

캐릭터의 인코딩을 원하십니까? –

+0

유효한 유니 코드 인코딩입니다. 아마 UTF-8. –

+5

UTF-8은 아마도? 넌 알아야 해. 봐야 할 code_points 및 길이조차도 인코딩에 따라 다릅니다. http://www.joelonsoftware.com/articles/Unicode.html을 참조하십시오. –

답변

4

International Components for Unicode 프로젝트를 보았습니까?

ICU는 소프트웨어 응용 프로그램에 대한 성숙하고 널리 사용되는 C/C 세트 ++ 및 유니 코드를 제공하는 자바 라이브러리 및 세계화 지원은 사이트에 따라. ICU는 이식성이 뛰어나며 이식 가능하며 모든 플랫폼에서 동일한 결과를 제공하고 C/C++와 Java 소프트웨어간에 을 제공합니다.

1

숯불 *이 아닌 char (또는보다 정확하게 wchar_t)에 해당 값을 할당 하시겠습니까?

0

이름의을 찾으십니까? ICU에 u_charName()을 입력하면 LATIN SMALL LETTER A과 같은 것을 반환합니다.