2012-10-16 3 views
8

제목에 따라 보호되지 않은 PDF 파일의 페이지를 javascript Image() 객체로 구문 분석 할 수있는 방법이 있습니까?PDF 페이지를 자바 스크립트로 파싱 이미지

자바 스크립트를 실행하기 전에 변환해도 좋지만 설치가 필요한 라이브러리의 도움없이 자동으로 수행하고 싶습니다.

누군가 인터넷상의이 Bash 스크립트를 게시했습니다. 불행히도 Bash는 모르지만 그것을 실행하는 것은 매우 간단합니다.

#!/bin/bash 
PDF='doc.pdf' 
NUMPAGES=`identify -format %n "$PDF"` 

for ((IDX=0; IDX<$NUMPAGES; IDX++)) 
do 
    PAGE=$(($IDX+1)) 
    convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"` 
done 

echo "Done" 

하지만 내가 가진 이러한 오류는 :

line 3: identify: command not found 
line 5: ((: IDX<: syntax error: operand expected (error token is "<") 

좋은 솔루션이 될 것 배쉬 스크립트를 사용하여 PDF 사전 변환. 누군가가 위의 스크립트를 수정하거나 대체 솔루션을 제공 할 수 있습니까?

미리 감사드립니다.

+0

왜 파이썬 당신이 무료로 사용할 수있는 gozillion 라이브러리의 1을 사용하지? – Ken

+0

@Ken, 이것에 대해 더 자세히 알려 줄 수 있습니까? –

답변

18

PDF.js을 사용하면 PDF를 캔버스로 렌더링 할 수 있습니다. 그러면 다음과 같이 할 수 있습니다 :

var img = new Image(); 
img.src = pdfCanvas.toDataURL(); 

나는 PDF.js에 깊은 인상을 받았습니다. 클라이언트의 브라우저에 최대한 많은 작업을 맡기는 것이 좋습니다. 여기

데모 : http://jsbin.com/pdfjs-helloworld-v2/1/edit

+0

! 나는 그것을 시도하고 완벽하게 보인다. – Saturnix

+7

데모가 더 이상 작동하지 않습니다 – Vanuan

+0

다음은 작동 코드가있는 요점입니다 : https://gist.github.com/ichord/9808444 – Anfuca

1

첫 번째 문제는 누락 된 실행 파일 인 것 같습니다 : .

http://www.imagemagick.org/script/index.php

당신은 또한 당신의 경로에 설치되어 있는지 확인하십시오 : 이것은 ImageMagick이의 일부입니다.

+0

그래서 imagemagick을 사용합니다! 아주 나쁘지 만 사용하지 않으려 고했지만 유일한 해결책 인 것처럼 보입니다. 고마워! – Saturnix

+0

@Saturnix'convert' 또한 imagemagick 라이브러리의 일부입니다.이 스크립트는 전적으로 imagemagick을 기반으로합니다. 덕분에 – Ken

관련 문제