2016-07-25 6 views
1

저는 PyPDF2를 사용하여 pdf에서 텍스트를 인쇄하려고합니다. 여기 내 코드는 다음과 같습니다.PyPDF2가 텍스트의 출력을 인쇄하지 않습니다.

import PyPDF2 
pdf_file = open('report.pdf', 'rb') 
read_pdf = PyPDF2.PdfFileReader(pdf_file) 
number_of_pages = read_pdf.getNumPages() 
page = read_pdf.getPage(1) 
page_content = page.extractText() 
print (page_content.encode('utf-8')) 

결과 일부 경고와 함께 빈 줄이 나타납니다.

PdfReadWarning: Xref table not zero-indexed. ID numbers for objects will be corrected. [pdf.py:1736] 
b'' 

나는이 경고 자체가 결과에 영향을주지는 않지만 내 경우에는 아무것도 얻지 못한다는 것을 확인했다. 어떤 제안. 감사합니다

답변

0

은 다음과 같이 코드를 변경해보십시오 :

import PyPDF2 
pdf_file = open('report.pdf', 'rb') 
read_pdf = PyPDF2.PdfFileReader(pdf_file) 
number_of_pages = read_pdf.getNumPages() 
page_content = read_pdf.getPage(1).extractText() 
print (page_content.encode('utf-8','strict')) 
관련 문제