소스 알파벳이 종료 기호로 a를 갖는 a, b, c이고 따라서 단위 간격이 [0, P (a), P a) + P (b), 1].산술 부호화, 종료 기호 및 빈 문자열
a (종료 기호)로 끝나는 b와 c의 묶음으로 구성된 문자열은 인코딩에 유효합니다. 중간에 a가있는 문자열은 인코딩에 유효하지 않은 것으로 간주됩니다.
그래서 [P (a), 1) 간격으로 인코딩 된 문자열을 쉽게 만들 수 있습니다. 그러나 산술적 인 코딩은 어떤 문자열에 간격 [0, P (a)]의 인코딩을 할당합니까? 빈 문자열이 [0, P (a)]에있는 비트 스트링으로 인코딩되는 것으로 자격을 부여합니까? 빈 문자열은 문자열 "a"또는 종료 기호로 생각할 수 있습니다.
빈 문자열을 인코딩 할 때 공간을 할당하는 것이 단위 간격의 첫 번째 부분을 [0, (P (b) -P (a))/(1-P (a) P (a), P (a) + P (b), 1]을 매핑하여 단위 구간을 채운다. 이후의 정제 부문은 평소처럼 [0, P (a), P (a) + P (b), 1]을 사용할 것입니다.
[cstheory.se]에 행운이 더 많을 수도 있습니다 –
확실하지 않습니다. [meta.cstheory.se]를 확인하고 원하는지 확인하십시오. – Will
이론 컴퓨터 과학 : [산술 코딩, 종료 기호 및 빈 문자열] (http://cstheory.stackexchange.com/questions/10819/arithmetic-coding-the-termination-symbol-and-theyempty-string)이 질문에 대한 답변이 더 많습니다. –