2012-05-19 2 views
3

리투아니아어 (lt_LT)와 ICU를 사용하고 있습니다. 이 언어의 알파벳은 다음과 같다 : 정렬 그러나 a ą b c č d e ę ė <...> v z žICU의 조합자는 "a"와 "±"가 동일하다고 가정합니다.

, ICU의 조합기는 예를 들어, aą (오고 넥과 a)이, 동일하므로 리투아니아어 단어의 목록이 같이 정리 될 것을 가정

a, ą, ab, aba, abadas, <...>, b, ba, <...>` 

예상 된 결과가 될 때 :

a, ab, aba, abadas, <...>, ą, <...>, b, ba, <...> 

같은 다른 "악센트"문자 (e으로 발생 -ė, z - -ž 등)

보다 구체적인 테스트 케이스 : 실행 source/samples/coll/coll -locale lt_LT -source ą -target aa은 그렇지 않습니다 때 필요한 경우 source is less than target은() coll.cpp을 볼 것을 결정한다.

이 동작이 필요합니까? 버그 또는 기능입니까? 그렇다면 ICU의 조합자가 "비슷한"글자를 함께 정렬하는 것을 방지하려면 어떻게해야합니까?

+2

ICU 목록을 요청하는 것이 좋습니다. – bmargulies

답변

3

문자는 CLDR 조정에 2 차 차이로 나열되어 있으므로 like so으로 정렬됩니다. 잘못된 경우 ICU 문제가 아닌 CLDR까지 가져 오십시오. Mimer 동의합니다.

관련 문제