2009-12-30 5 views
0

프로그래밍 방식으로 pdf 파일을 구문 분석하고 특정 문구를 찾고 각 문구가있는 페이지 번호를 찾고 싶습니다. 이것이 가능합니까 (저는 pdf가 텍스트 파일과 같지 않음을 이해합니다)? 그렇다면 라이브러리가 도움이 될까요?pdf를 구문 분석하고 구문이있는 페이지 식별

+0

어떤 언어 및 플랫폼을 사용 하시겠습니까? – mauris

답변

0

Apache Lucene project에서 찾을 수있는 Apache Tika에는 작업 할 수있는 텍스트를 가져올 PDFBox가 포함되어 있습니다.

관련 문제