2013-09-05 3 views
0

Sabon 글꼴의 개인 영역에 문자가 포함 된 XML 문서를 구문 분석하고 있습니다. 글꼴을 Times New Roman으로 변경해야하기 때문에 이러한 문자를 대체해야합니다. 지금까지 모든 것이 좋습니다.유니 코드 합자 SS

이제는 SS처럼 보이는 문자 (두 개짜리 합자와 같은 이중 문자)를 대체해야합니다. 나는 타임즈를 검사하고 해당 숯을 찾지 못했습니다. 누군가가 유니 코드에 그러한 것이 있는지 여부를 알고 있습니까?

+1

Sabon의 버전은 무엇입니까? 개인 영역에 문자가 있는지 확인 하시겠습니까? 그것은 "SS"인가 "ss"인가? 이미지를 게시하면 도움이됩니다. 일반적으로 유니 코드는 합자가 아닌 문자를 인코딩합니다. –

+0

글꼴의 전체 이름은 Sabon LT Std, 파일 버전은 1.040입니다. 다음은 복사 된 문자열입니다 : B. 이것은 BROUSSONET처럼 보입니다. 첫 글자는 더 크고 다른 글자들은 대문자입니다. – strohne

+0

그리고 그것이 SS로 대체하고 싶은 문자입니다 : ² – strohne

답변

3

이것은 수수께끼 같지만 나는 당신이보고있는 글립 문자가 "ß"U + 00DF LATIN SMALL LETTER SHARP S (종종 "German double s")에 대한 작은 대문자 글리프라고 생각합니다. 브루소 넷은 프랑스 자연 주의자 였고 프랑스어는 "ß"를 사용하지 않았기 때문에 (독일어는 외국 이름에 "ß"를 사용하지 않기 때문에) 주석에 언급 된 단어에 대해서는 거의 이해가되지 않을 것입니다. Broußonet "은 Google이 발견 한 이상한 철자가 틀림 없습니다.

복사 된 문자열에는 Sabon이 작은 대문자로 사용하는 비공개 사용 코드 포인트가 포함되어 있습니다. 일반적으로 작은 대문자는 정의에 따라 이식 할 수없는 개인용 코드 포인트보다는 OpenType 기능을 사용하여 선택할 수있는 글리프 변형으로 포함되기 때문에 다소 이상합니다.

문자열에 "Broussonet"이 포함되어 있고 Sabon의 작은 대문자 "s"에 사용되는 개인용 코드 포인트의 두 사본으로 표현되는 "ss"가 있기 때문에 여전히 문제가 설명되지 않습니다. 아마도 "ss"와 "ß"사이의 전환은 어딘가에서 일어날 것입니다. 어쨌든, 두 번째 주석의 "문자"는 Sabon의 작은 대문자 "ß", CFF 글리프 id germandbls.sc에 사용되는 개인용 코드 포인트 인 U + E03F입니다.

그러나 실제로 텍스트가 대문자로 해석되는 경우 첫 번째 문자 이외의 문자는 작은 대문자로 표시되고 "SS"는 대문자 "ß"로 해석되거나 대체되면 "ß"U + 1E9E LATIN 대문자 레터 SHARP S. 대문자 정규화에서 "ß"는 대문자로 "SS"(일반 문자 "S"의 두 부)로 매핑되지만 요즘에는 유니 코드도 U + 1E9E를 사용하여 만나게됩니다 이름이 모두 대문자로 쓰여졌을 때 Strauss 대 Strauß와 같이 맞춤법의 차이를 보존 할 필요성. 최신 버전의 Times New Roman에는 "ẞ"이라는 문자가 있지만 이전 버전에서는 그렇지 않습니다 (U + 1E9E는 2008 년 4 월 Unicode 버전 5.1에 추가되었습니다).

+0

"Broussonet"의 예는 오도 된 것입니다. 실제로는 SS 글리프가없고 단지 두 개의 S.가 있습니다. 죄송합니다. 설명 주셔서 감사합니다, 절대적으로 의미가 있습니다, 나는 그것을 2 개의 S로 대체 할 것입니다. – strohne

관련 문제