2012-09-01 2 views

답변

1

"코드 페이지의 다음 항목"을 의미하는 경우 항상 바이트로 해킹하고 알아낼 수 있습니다. 순차적으로 코드 페이지를 탐색하면 할당 된 문자가없는 구멍에 빠질 가능성이 큽니다. 그러한 용어를 상상할 수 있다면 "유비 쿼트 적으로"유니 코드를 의미합니다.

"알파벳순"을 의미하는 경우 아무 의미가 없으므로 운이 좋지 않습니다. 알파벳 순서의 개념은 한 언어에서 다른 언어로 상당히 다양하며 경우에 따라 상황에 따라 다릅니다. 일부 언어는 문자에 대한 명령을 전혀 갖지 않습니다. 일부 시스템에서 인코딩 외에 데이터 정렬 이있는 이유입니다. 데이터 정렬은 순서를 정의하지만, 종종 많은 문자가 정렬 목적으로 동등한 것으로 간주되어 사물을 더 복잡하게 만듭니다.

또한 Ruby 1.8.7은 일반적으로 유니 코드를 인식하지 못하고 모든 것이 1 바이트 문자로 된 8 비트 ASCII 문자열 인 것처럼 가장합니다. Ruby 1.9는 멀티 바이트 UTF-8을 별도의 문자로 구문 분석 할 수 있으므로이 연습을 훨씬 쉽게 할 수 있습니다.

+1

여기서는 데이터 정렬 인식 문자열 비교를 지원하는 Lib에 대해 설명합니다. http://stackoverflow.com/a/5472046/166921 –

관련 문제