ISDB (ARIB) 전송 스트림에 인코딩 된 텍스트 문자열을 디코딩하는 방법은 무엇입니까?

ISDB (ARIB) 전송 스트림에 인코딩 된 텍스트 문자열을 디코딩하는 방법은 무엇입니까? 일부 부호화 기술은 ARIB STD-B24 버전 5.2 (볼륨 1) 규격의 2 부 (단일 매체 부호화)의 7 장에 명시되어있다. 그러나이 인코딩이 EUC-JP, ISO-2022-JP, JIS X208 등과 같은 다른 표준 일본어 문자 인코딩 기술과 다른지 여부는 확실하지 않습니다.이 인코딩 표준 이름은 무엇입니까?ISDB (ARIB) 전송 스트림에 인코딩 된 텍스트 문자열을 디코딩하는 방법은 무엇입니까?

ISDB 스트림에 사용 된 인코딩 이름 (코드 페이지)을 알고 있다면 ICU와 같은 타사 라이브러리를 다음과 같이 사용할 수 있습니다.

UConverter ucnv_open * (* CHAR CONST converterName, UErrorCode * ERR) ucnv_open 전환 = ("SHIFT_JIS"& 상태); len = ucnv_toUChars (전환, 타겟, 100, 소스, strlen (소스), & 상태); ucnv_close (전환);

또한 ISDB 전송 스트림에서 가져온 ARIB 문자열을 자체적으로 디코딩하려고 시도했지만 나에게 명확하지 않은 몇 가지 문제가 발생했습니다.

G0, G1, G2 및 G3 그래픽 세트가 4 개 있습니다. 내가 이해하는 것은 세트의 초기 값이 G0 있다는 것입니다 : 한자 시스템은 G1을 설정 영숫자는 G2를 설정 : 히라가나 G3을 설정 매크로 코드가

을 설정

수 G0, G1, G2와 G3의 값 때때로 변경되거나 고정 된 채로 남아 있습니까? 매크로 코드 집합이란 무엇입니까?

디코딩 할 때 "코드 요소 호출"과 "그래픽 세트 지정"의 두 가지 개념이 있습니다. 이스케이프 코드에서 이것을 어떻게 사용합니까? 예를 들어 스트림에서 가져온 다음 문자열의 디코딩을 시도했습니다.

1b 7c c1 e3 f3 cd eb 26 41 1b 7d fe 4e 78 30 26 37 6b 3a 27 ce 4b 21 42 27 0e 28 1b 7c eb f9 eb 29 0f 21 21 0e 23 30 38 1b 24 3b 0f 7a 6a 7a 56 59

GL 및 GR 값을 얻는 방법, 위의 문자열 및 문자 당 2 바이트 또는 1 바이트 사용 여부는 어떻게됩니까? 아무도 위의 문자열을 디코딩 할 수있는 힌트를 제공하면 매우 유용 할 것입니다.

출처

2009-12-04 Ankur

디코딩

6-STD-B24v5_2-1p3 E1.pdf

제 2, 제 7

기본 세트의 제 3, 제 8

지정

만든

G0 = Kanji (2 Byte) JIS X 0213:2004 8-bit code vs Unicode mapping table 
G1 = AlphaNumeric (1 Byte) 
G2 = Hiragana (1 Byte) 
G3 = Macro code set (not decoded by the example below!!)

호출

GL <= G0 
GR <= G2

디코딩 :

1b 7c // Invocation GR <= G3 
c1 // Right Table, Makro, Symbol.. 
e3 // ... sorry no .. 
f3 // ... idea .. 
cd // ... 
eb // ... 
26 41 // Left table, 2 bytes 0x2641 U+03B1 # GREEK SMALL LETTER ALPHA 
1b 7d // Invocation GR <= G2 
fe // right table hiragana WideChar($7E + $3020); 
4e 78 // Left table 0x4E78 U+604B # <cjk> 
30 26 //   0x3026 U+611B # <cjk> 
37 6b //   0x376B U+7D50 # <cjk> 
3a 27 //   0x3A27 U+5A5A # <cjk> 
ce // right table hiragana WideChar($4E + $3020); 
4b 21 // left table 0x4B21 U+6CD5 # <cjk> 
42 27 // 0x4227 U+5247 # <cjk> 
0e // Invocation GL <= G1 
28 // left table "(" 
1b 7c // Invocation GR <= G3 
eb // right table, makro, symbols 
f9 // ... no idea 
eb // ... no idea 
29 // left table ")" 
0f // Invocation GL <= G0 
21 21 // left table 0x2121 U+3000 # IDEOGRAPHIC SPACE 
0e // Invocation GL <= G1 
23 // left table "#" 
30 // left table "0" 
38 // left table "8" 
1b 24 3b // Designation G0 <= Additional Symbols 
0f // Invocation GL <= G0 
7a 6a // Left Table, addional symbols 2 Byte code, cell 74 row 90 (rebroadcast) 
7a 56 // cell 54 row 90 (closed-captioned broadcast) 
7a 59 // cell 57 row 90 (stereo broadcasting service)

α ゞ恋愛結婚の法則() # 08

전체 α ゞ 사랑 결혼 법() # 08

출처

2013-09-06 14:13:39 nobody

ISDB (ARIB) 전송 스트림에 인코딩 된 텍스트 문자열을 디코딩하는 방법은 무엇입니까?

답변

관련 문제