0
프로그래밍 방식으로 pdf 파일을 구문 분석하고 특정 문구를 찾고 각 문구가있는 페이지 번호를 찾고 싶습니다. 이것이 가능합니까 (저는 pdf가 텍스트 파일과 같지 않음을 이해합니다)? 그렇다면 라이브러리가 도움이 될까요?pdf를 구문 분석하고 구문이있는 페이지 식별
프로그래밍 방식으로 pdf 파일을 구문 분석하고 특정 문구를 찾고 각 문구가있는 페이지 번호를 찾고 싶습니다. 이것이 가능합니까 (저는 pdf가 텍스트 파일과 같지 않음을 이해합니다)? 그렇다면 라이브러리가 도움이 될까요?pdf를 구문 분석하고 구문이있는 페이지 식별
Apache Lucene project에서 찾을 수있는 Apache Tika에는 작업 할 수있는 텍스트를 가져올 PDFBox가 포함되어 있습니다.
어떤 언어 및 플랫폼을 사용 하시겠습니까? – mauris