2013-10-07 3 views
0

protobuf가 일반적으로 사용되는 영숫자 형식의 지원을 구현하지 않는 이유가 궁금합니다. 이렇게하면 모든 종류의 압축이 필요 없으므로 여러 문자를 바이트로만 인코딩 할 수 있습니다 (대소 문자를 구분하지 않는 경우). Protobuf 개발자가 향후 구현할 계획입니까? 오늘날의 글로벌 세계에서protobuf가 영숫자 형식을 지원하지 않는 이유는 무엇입니까?

+0

UTF-8로 인코딩 된'string' 유형을 지원합니다. [프로토콜 버퍼 - 스칼라 값 유형] (https://developers.google.com/protocol-buffers/docs/proto) – shyam

답변

2

가, 횟수 "문자 및 숫자"범위 0에서 62 개 문자 의미

감사합니다, - 9A - Za - z 상당히 최소한이다. 기본 다국어 평면을 고려해 보면 "영숫자"로 간주되는 약 48k 코드 단위 (사용 가능한 범위의 70 % 이상)와 상당히 표준적인 코드 단위가 있습니다 (일부 경우에도이 점이 차선책 일 수 있음) 로케일) 인코딩 방법은 UTF-8이며, protobuf는 이미 string 유형을 사용합니다.

이 데이터 범주에 전용 와이어 유형을 사용할 때 많은 이점을 볼 수 없으며 추가 와이어 유형은 여러 라이브러리에 추가 지원이 필요하다는 문제가 있습니다. 알 수없는 와이어 유형 은 스트림을 읽을 수 없도록 렌더링합니다.은 하위 수준 파서입니다. 와이어 유형을 알지 못하는 경우 원치 않는 데이터는 건너 뛸 수 없습니다 (와이어 유형이 스킵 규칙을 정의 함).

물론 bytes 유형을 사용할 수 있으므로 안에 넣으려는 것이 무엇이든 할 수 있습니다.

관련 문제