PDF에서 텍스트를 추출하고 가능한 한 원래 레이아웃 (예 : 테이블, 컬럼 등)을 유지하면서 일반 텍스트로 서식을 지정하기위한 유틸리티 또는 라이브러리를 찾고 있습니다.형식이있는 ASCII로 PDF 변환 - 현재 상태는 어떻습니까?
우리는 현재 pdftotext를 사용하고 있지만 더 좋은 점이 있는지 궁금합니다. 명령 행 도구이거나 앱에 링크 할 수있는 라이브러리 여야합니다.
pdftotext는 좋은 것처럼 보이거나 더 좋은 점이 있습니까?
많은 pdf 도서관이 있습니다 ... 그냥 Google로. –