유니 코드 코드 단위는 2 바이트 이상 (2 바이트 시퀀스)으로 문자를 나타낼 수 있기 때문에 가변 크기 일 수 있습니다. 바이너리 형식으로 저장하면 프로그램에서이를 어떻게 읽을 지 어떻게 알 수 있습니까?프로그램이 유니 코드를 어떻게 읽습니까?
그런 다음0F0F 13F3 02AD BC39 09F3 459F
어떻게 어디서 중지 알 것 :
'는'0F0F 13F3
로 표현하고 내가 파일에 foo.txt에서 그들을 작성하는 경우 'B'가 02AD BC39 09F3 459F
으로 표시됩니다 말할 수 있습니다 'a'와 'b'에 대해서?
여기 사람들 나는 utf-8과 같은 인기있는 문자셋을 기반으로하는 다른 형식으로 변환하지 않고 순수한 유니 코드를 쓰는 것을 말하고 있습니다.
유니 코드를 설명 할 때 용어는 중요합니다. 코드 단위, 코드 포인트 및 문자를 함께 흐리게 처리합니다 (세 가지 용어). 인코딩 (UTF-8, UTF-16, UTF-32) 코드 단위는 고정 길이입니다. (1, 2 W 4 Y이트) 코드 포인트는 UTF-8 W UTF-16로 여러 코드 단위를 요구할 수 있습니다. 아래의 좋은 답변 외에도 unicode.org/glossary – Thanatos
@ Thanatos 저를 도와 주셔서 감사합니다. –