2012-01-06 6 views
6

현재 Google은 PDF 파일에서 온라인 도서를 생성하기 위해 여러 게시자와 협력하고 있습니다. 우리의 기존 앱은 flex를 사용하기 때문에 PDF2SWF에 의해 SWFTools을 사용하여 PDF를 SWF 파일로 변환합니다.PDF 내 글꼴 파일 액세스

우리가 가지고있는 문제는 사용자가 검색을 수행 할 때 SWF 문서 내의 텍스트가 flex reader에 의해 강조 표시되지 않는다는 것입니다. 위의 코드에서 볼 수 있듯이, 우리는 경로를 필요

http://wiki.swftools.org/wiki/How_do_I_highlight_text_in_the_SWF%3F

pdf2swf -F $YOUR_FONTS_DIR$ -f input.pdf -o output.swf 

: 빠른 조사 후 우리는 텍스트를 추출 할 때 우리는 PDF 문서에서 사용되는 글꼴을 포함 할 필요가 있음을 발견 글꼴 디렉토리에는 해당 PDF에서 찾을 수있는 글꼴이 들어 있습니다.

우리는 많은 PDF 파일을 변환 할 것이므로 많은 글꼴을 우리 앱에 저장하는 대신 PDF를 통해 직접 글꼴 파일에 액세스 할 수 있습니까?

추가 정보

우리의 응용 프로그램은 자바로 작성된 것입니다.

우리는 현재 앱 내에서 PDFBox와 Ghostscript를 사용하고 있으므로 어떤 솔루션이 이러한 라이브러리를 사용하면 기본 옵션이 될 수 있지만 모든 아이디어에 대해 열려 있습니다.

+0

관련 질문 : http://stackoverflow.com/ q/3488042/681807 –

답변

7

PDF 파일에는 글꼴 '파일'이 포함되어 있지 않지만 글꼴은 전혀 포함되지 않을 수도 있습니다.

  • 타입 1 PostScript 글꼴
  • 타입 3 포스트 스크립트
  • 폰트 TrueType 폰트
  • 포스트 스크립트 CFF 폰트 타입 1 포스트 스크립트 윤곽선
  • CIDFonts : 내장 폰트 데이터 포맷 어리둥절 다양 할 수있다
  • 유형 3의 CID 글꼴 포스트 스크립트 개요
  • 트루 타입 외곽선이있는 CID 글꼴
  • CFF와
  • CIDFonts는 비트 맵 이미지와
  • CIDFonts

응용 프로그램이 모든 다음 글꼴 형식을 읽을 수있을 것인가를 설명? 을 사용하려면은 PDF 파일에 포함 된 글꼴을 사용해야합니다.이 글꼴은 대개 하위 집합 글꼴이 될 것이고 사용자 지정 인코딩이 제공되므로 원래 글꼴이 있어도이 글꼴을 사용할 수 없습니다. 인코딩이 올바르지 않기 때문에 그것을 사용하십시오.

물론 그것이이 PDF 파일이 모두 일관된 방식으로 만들어지며 포함 된 글꼴을 사용하지 않는 것이있을 수 있습니다,하지만 난 내 의심이 ....

+0

CIDFonts는 일반적으로 유니 코드 문자 코드로 매핑되지 않으므로 PDF에 이러한 문자가 포함되어 있으면 검색을 위해 문서 문자를 유니 코드 문자로 매핑하는 데 어려움을 겪습니다. – Rup

+0

@KenS - 답변 해 주셔서 감사합니다.귀하의 의심은 정확합니다, PDF의 임베디드 하위 집합 글꼴을 사용하고 있습니다. 나는 당신이 당신의 대답을 뒷받침 할 원천이 없다고 생각하지 않습니까? –

+1

@Rup - 지적 해 주셔서 고맙습니다. 우리는 다양한 언어를 지원하지만, 어떤 스크립트 스타일의 언어 (일본어, 한국어 등)는 지원하지 않을 것입니다. –