2012-03-14 3 views
2

pdf 파일을 구문 분석하고 파일을 추출하려고합니다. 누구든지 특정 perl 모듈을 나열 할 수 있습니까?CPAN PDF 파일을 구문 분석하기위한 Perl 모듈

감사합니다. 그런 다음 그것을 실천하지 않을 수 있습니다 문서에서 텍스트를 구문 분석하려는 경우

답변

2

당신은

CAM::PDF

또는

PDF::API3

보고 시도 할 수 있습니다. CAM :: PDF :: Text

이 모듈은 PDF 페이지에서 순차적 텍스트를 추출하려고 시도합니다. 이 은 임의의 순서로 에 PDF 텍스트가 그래픽으로 배치되어 있기 때문에 강력한 프로세스가 아닙니다. 이 모듈은 어떤 다른 텍스트 옆에 어떤 일이 일어나는지 텍스트 를 추측하려고 몇 가지 추론을 사용하지만,에 의해, 이, 첨자, 수평이 아닌 텍스트, 글꼴 변경, 양식 필드 등

말을 쉽게 속지 수 있습니다
관련 문제