pdf에서 일부 정보를 추출하려고합니다. CAM::PDF
모듈의 getpdftext.pl
을 사용하려고합니다. $~ getpdftext.pl sample.pdf
을 실행하면 stdout으로 pdf 텍스트가 생성됩니다.perl에서 pdf 구문 분석하기
그러나 나는 이것을 텍스트 파일에 작성하고 펄에서 필수 필드를 분석 할 생각이다. 누군가 이걸 어떻게 할 수 있는지 안내해 주시겠습니까?
하지만 내 펄 스크립트 안에 pdftotext.pl
을 호출하려고하면 No such file
오류가 발생합니다.
#program은 PDF에서 텍스트를 추출하고
use PDF;
use CAM::PDF;
use CAM::PDF::PageText;
use warnings;
use IPC::System::Simple qw(system capture);
$filein = 'sample.pdf';
$fileout = 'output1.txt';
open OUT, ">$fileout" or die "error: $!";
open IN, "getpdftext.pl $filein" or die "error :$!" ;
while(<IN>)
{
print OUT $fileout;
}
감사합니다 mob, - | 옵션이 도움이되었습니다 – sandyutd