2012-01-12 4 views

답변

3

java.text.Collator 중국 Locale에 대해 시도하십시오.

+2

감사합니다. 그것은 'Locale.SIMPLIFIED_CHINESE'는 중국어 병음에 의해 정렬되었지만'Locale.TRADITIONAL_CHINESE'는 스트로크에 의해 정렬되었습니다. – bydsky

+0

병음이나 뇌졸중이 무엇인지 전혀 알지 못하지만 도움이 되었기 때문에 기쁩니다. –

2

코드를 직접 롤인하려면 유니 코드 컨소시엄의 Unihan 데이터베이스의 Radical-Stroke Counts 필드가 있어야합니다. 기술 보고서 ​​38의 해당 부분에 대한 링크가 링크입니다.

표의 문자의 획수는 표시되는 문자의 구조 (또는 형태), 즉 문자 모양을 기반으로합니다. 문자 모양의 형태는 글꼴 디자인 스타일의 기능입니다. 특히 글꼴이 중국어 번체, 중국어 간체 또는 일본어 규칙을 따르는 지 여부가 중요합니다. 그러나 Java의 문자 코드는 일반적으로 유니 코드 표준을 기반으로합니다. 유니 코드 표준은 이러한 모든 규칙의 문자를 단일 문자 코드로 통합합니다.

따라서 외부에서 텍스트를 사용하여 어떤 규칙을 사용했는지 알려줄 정보가 필요합니다. Unihan 데이터베이스의 어느 필드를 사용할 지 알려줍니다. 중국어 텍스트 문자열이 모두 단순화되었거나 모든 중국어 번체가 알면 충분한 정보를 얻을 수 있습니다.

또한 Unihan 데이터베이스의 데이터를 처리하는 Chinese Character Web API을 확인하십시오.

관련 문제