여러 페이지 PDF에서 한 페이지 당 TIFF를 추출해야하는 프로젝트를 진행하고 있습니다. PDF는 이미지 만 포함하고 있으며 페이지 당 하나의 이미지가 있습니다 (필자는 일종의 복사기/스캐너로 제작되었지만이를 확인하지는 않았다고 생각합니다). TIFF는 문서의 여러 다른 파생 버전을 만드는 데 사용되므로 해상도가 높을수록 좋습니다.PDF 크기의 고해상도 이미지
나는 두 가지 조리법을 모두 유용한 측면에서 발견했지만 어느 것도 이상적이지 않습니다. 누군가를 원하면 그 중 하나를 조정하거나 세 번째 옵션을 제공 할 수 있습니다.
레시피 1, pdfimages와 ImageMagick이 :
먼저 수행
(foo-000.pbm
foo-001.pbm
이름)
.pbm
여러 파일 결과
$ pdfimages $MY_PDF.pdf foo"
등 각 *.pbm
에 대한 다음
해야 할 일 :
$ convert $each -resize 3200x3200\> -quality 100 $new_name.tif
,451,515,
프로 : 결과의 TIFFs은 긴 치수에 건강한 3300+ 픽셀이며,
콘 (-resize은 모든 것을 정상화하는 역할) : 페이지의 방향이 손실되고, 그들이 밖으로 서로 다른 방향으로 회전 온 (논리 패턴을 따르므로 스캐너에 공급되는 방향 일 수 있습니다.). 솔로
레시피 2있는 Imagemagick :
이 나에게 페이지 당 TIFF 제공convert +adjoin $MY_PDF.pdf pages.tif
(pages-0.tif
, pages-1.tif
를, 등).
프로 : 오리엔테이션이 그대로!
단점 : 결과 파일의 길이가 길면 < 800px가됩니다.이 파일은 너무 작아서 유용하지 않을 수 있으며 약간의 압축이 적용된 것처럼 보입니다.
PDF에서 이미지 스트림의 배율을 어떻게 떨어 뜨리지 만 오리엔테이션을 유지할 수 있습니까? 내가 잃어버린 ImageMagick에 더 많은 magick가 있습니까? 완전히 다른 것?
무료가 아닌 솔루션을 사용 하시겠습니까? – BitBank
아마도 - API가 있어야하고 (GUI가 필요하지 않습니다) 통합 할 수 있어야합니다. 저는 수만 명의 문서를 다루고 있습니다. 너는 무엇을 염두에두고 있니? – JStroop
세부 정보를 보내 주시면 도와 드리겠습니다. ([email protected]). – BitBank