내 회사에서 유니 코드와 인코딩에 대한 기술 토론을하고 있는데, 여기에서 strings are always encoded이라는 요점을 만들려고 노력하고 있으며 개발자는 부주의하게 모든 정보가 0으로 가정되어서는 안됩니다. 127 ASCII.유니 코드 : 코드 포인트 127 위의 영어 문자
내가 잘못 인코딩 된 텍스트로 인한 문제의 많은 증거를 가지고,하지만 난 기본 영어 알파벳 유니 코드에 매핑되는 유니 코드 code point 127
위의 인코딩 된 번호와 간단한 영어 텍스트의 예를 찾을 수 없습니다 일반 숫자 ASCII와 동일한 숫자 값으로 지정합니다. A-Z
은 [65-90]
(또는 16 진수는 [0x41-0x5a]
)으로 매핑되고 [a-z]
은 [97-122]
(16 진수 [0x61-0x7a]
)으로 매핑됩니다.
영어 알파벳이 코드 차트의 다른 곳에 나타 납니까? 나는 단순한 영어 알파벳 circumflex letters or other Latin variants을 의미하지 않습니다.
* "문자열은 항상 인코딩되어야하며 일반 텍스트로 처리되지 않습니다"?! * 죄송합니다. 문자열이 일반 텍스트 인 경우에도 문자열은 항상 인코딩 됨 * (http://kunststube.net/encoding/). 당신이 의미 한 것을 분명히 할 수 있을까요? – deceze
물론. 나는 개발자들이 항상 문자열이 인코딩된다는 것을 명심해야하고 문자열을 "일반 텍스트"로 취급해서는 안된다는 것을 의미했습니다. –
그에 따라 내 질문이 수정되었습니다. 감사. –