2010-05-23 3 views
2
3 begincidrange 
<20> <7e> 1 
<8140> <817e> 633 
<8180> <81ac> 696 
endcidrange 

이것은 CMAP 파일 샘플입니다.pdf 텍스트 추출

  1. 내 데이터 용으로 CMAP를 만들려면 어떻게해야합니까?
  2. 무엇이 3 인 3 데시 칸트 렌드입니까?
  3. 무엇이 < 20> < 7e>입니까? 아무도 예제를 줄 수 있습니까
+0

3은 범위의 줄 수입니다. 나머지에 관한 어떤 생각이 아니라도. – Personman

답변

1

CMap 테이블은 모든 문자 코드를 CID 매핑으로 설정합니다.

begincidrange 연산자 앞에 나타나는 숫자는 행의 맵핑 수를 나타냅니다. endcidrange 연산자는 매핑 블록을 종료합니다.

begincidrange와 endcidrange 사이의 행에는 맵핑이 들어 있습니다. 각 행에는 3 개의 항목이 있습니다. 첫 번째 두 개는 문자 코드 범위를 지정하고 세 번째는 문자 코드 범위를 매핑하는 CID 값입니다. 0x7E가지도에

그래서 문자 코드가 0x20 1.

어도비 기술 노트 5099은 CID 테이블 형식을 설명 CID합니다.

+0

정확하지 않습니다. 'range' 섹션의 매핑은 실제로 연속 매핑을 지정하므로 0x20에서 0x7e는 1에서 95 사이의 여러 CID에 매핑됩니다 (0x7e - 0x20는 10 진수 94이므로). 이것은 실제로 [spec] (http://www.iemens.adobe.com/content/dam/Adobe/en/devnet/font/pdfs/5099.CMapResources.pdf)에 언급되어 있습니다. – Sam