2017-01-11 2 views
0

나는 첨부 파일을 포함하는 이메일 스레드로 구성된 pdf 포트폴리오를 가지고있다. 각 이메일에서 텍스트를 읽고 첨부 파일을 추출하고 싶습니다. 그러나, 나는 파이썬에서 pdf 포트폴리오를 읽는 방법에 대한 정보를 찾을 수 없다. 필자는 PDFMiner 및 textract 라이브러리를 사용해 보았지만 "최상의 경험을 위해이 PDF 포트폴리오를 Acrobat X 또는 Adobe Reader X 이상에서 열면 Adobe Reader를 지금 받으십시오!"라고 간단하게 출력됩니다.Python에서 PDF 포트폴리오 읽기?

아이디어가 있으십니까? 감사!

답변

0

유틸리티의 pdfdetach 프로그램은 첨부 파일을 추출 할 수 있습니다.

대부분의 UNIX 계열 운영 체제 배포판은 poppler-utils 패키지를 사용할 수 있습니다. SourceForge에서 ms-windows 버전을 찾을 수 있습니다.

subprocess 모듈을 사용하여 Python에서이 프로그램을 호출 할 수 있습니다.