Perl을 사용하여 정보를 추출하려면 PDF 파일을 텍스트로 변환해야합니다. 그러나 텍스트 파일을 위치 형식으로 가져 오지 못하는 것은 PDF의 요소 위치가 같아야한다는 것을 의미합니다. 나는 CAM::PDF::PageText
을 시도했지만 출력이 매우 다릅니다.PDF에서 텍스트로 위치 데이터를 얻는 방법
나는 pdftotext 및 Poppler를 언급하는 게시물을 발견했지만 내 Windows 10 64 비트 시스템에서는 이들 중 하나를 설정할 수 없습니다.
이 문제를 해결할 수있는 다른 방법이 있으면 알려주십시오.
http://stackoverflow.com/questions/6104045/installing-poppler-on-cygwin – xxfelixxx
텍스트 편집기에서 Acrobat의 텍스트를 복사하여 붙여 넣은 것으로 생각하십니까? – Borodin
붙여 넣기 데이터를 복사 할 수 있지만 나중에 텍스트 파일에서 정보를 추출해야하므로 형식이 PDF와 유사하지 않습니다. – Mohit