여러개의 PDF 문서를 프로그래밍 방식으로 분석하고 결합하여 특수한 방법으로 페이지를 연결해야합니다. 각 PDF에는 링크가 속한 각 위치의 텍스트가 링크 대상을 나타냅니다. 나는 pdfminer
을 사용하여 링크가 있어야하는 위치와 텍스트를 추출합니다. 이제 그 링크를 실제로 만들어야합니다.PDF 문서에 문서 링크 추가
저는 약간의 연구를 수행했으며 PyPDF2
이이를 가정 할 수 있다고 결론을 내 렸습니다. 여하튼, 작업을 완료한다고 주장하는 겉으로는 직설적 인 addLink
방법이 있습니다. 나는 그걸 작동시킬 수 없다.
from PyPDF2 import PdfFileWriter
from PyPDF2.pdf import RectangleObject
out = PdfFileWriter()
out.insertBlankPage(800, 1000)
out.insertBlankPage(800, 1000)
# rect = [400, 400, 600, 600] # This doesn't seem to work either
rect = RectangleObject([400, 400, 600, 600])
out.addLink(0, 1, rect) # link from first to second page
with open(r'C:\temp\test.pdf', 'wb') as outf:
out.write(outf)
위의 코드는 최소한 내가 알 수있는 한 아름다운 두 페이지 PDF를 생성합니다. 밖에있는 사람이 이것이 어떻게 성취 될 수 있는지 알고 있습니까? 아니면 적어도 내가 잘못 가고있는 것의 표시?
라이브러리는 자유롭게 라이센스가있는 한 솔루션에 PyPDF2를 사용할 필요가 없습니다. 엄밀히 말하자면, 파이썬은 요구 사항조차도 아니지만, 다른 언어를 해킹하지 않고 이것을 현재 구조에 맞추는 것이 좋을 것입니다.