2012-11-29 2 views
1

RTF 텍스트를 유니 코드로 변환하고 싶습니다. RTF 글꼴 테이블에서 폰트 또는 글꼴의 이름 (예 : Arial Cyr, Courier Greek)과 함께 사용할 문자 세트 (0-255)를 찾을 수 있습니다. 그렇다면이 설정을 사용하여 문자 코드 (0-255)를 유니 코드로 변환하는 함수를 작성하는 방법은 무엇입니까?ANSI 텍스트를 유니 코드로 변환하는 방법은 무엇입니까?

그리스어, Cyr, Tur 등의 포스트 태그는 표시된 문자의 글립 문자에 영향을 미치며 문자 세트에서도 영향을 미칩니다. 그래서 기능이 입력 매개 변수 수 :

글꼴 이름 접미사, 글꼴 캐릭터, 문자 코드

을하지만 다음인가? 아니면 잘못된 길로 가고 있습니까?

+0

어떤 프로그래밍 언어입니까? 또한 글꼴은 관련이 없으므로 charset을 예를 들어 UTF-8로 변환하면됩니다. - [모든 프로그래머가 절대적으로 인코딩 및 문자 세트에 대해 알기 위해 적극적으로 필요로하는 내용] (http : //kunststube.net/encoding/) – deceze

+1

여기가 중복되어 있습니다. http://stackoverflow.com/questions/2192319/python-convert-rtf-file-to-unicode – varun

+0

저는 C++에서 windows 아래 있습니다. 예를 들어, Symbol, Webding 및 다른 특수 글꼴 이름이 문제를 일으킬 수 있기 때문에 글꼴이 관련이 없다고 생각하지 않습니다. 그리고 글꼴 이름 접미사도 중요합니다. 그러나 Windows에서 이러한 접미사를 처리하는 방법은 알 수 없습니다. – user1863784

답변

3

RTF는 오랫동안 유니 코드보다 오래 발명되었습니다. 가장 확실하게 ANSI 텍스트가 아니며 RTF는 ASCII 만 사용합니다. 문자 집합에 대한 참조가있는 16 진수로 인코딩 된 비 ASCII 문자가 포함 된 다소 복잡한 조합을 사용합니다. 매핑도 완벽하지 않으며 많은 유니 코드 코드 포인트에는 해당 문자 집합이 없습니다.

RTF 유니 코드 변환기를 만드는 일생을 보내십시오. 기존 솔루션을 활용하십시오. 대부분의 플랫폼에 하나가 있습니다. Windows에서 RichEdit 컨트롤이 될 것입니다. .NET을 사용한다면 RichTextBox 클래스를 사용하고 Rtf 속성을 할당하고 Text 속성을 다시 읽는 것이 특히 간단합니다. utf-16으로 인코딩 된 유니 코드는 어느 것입니까?

+0

대단히 감사합니다. 한스! 나는 이것을 시도하고 결과를 나눌 것이다. – user1863784

관련 문제