2016-10-27 3 views
1

내 PDF 데이터 코퍼스의 사용자 정의 검색 엔진에서 작업하고 있습니다.Python을 사용하여 PDF의 텍스트 강조 표시

저는 PDF 내용을 텍스트로 덤프 할 수있는 변환 레이어가 있습니다 (Apache Tika 및 GROBID 사용). 검색 결과를 반환하는 검색 레이어와보기를 완료했습니다.

이제 검색 용어가 등장한 행에 원본 PDF에 강조 표시 기능을 추가하고 싶습니다. 예, 필요한 경우 PDF 파일을 수정하고 싶습니다.

PDF 파일에 하이라이트 텍스트를 삽입 할 수있는 방법이 있습니까? PDFMiner 또는 PyPDF2 또는 다른 Python 라이브러리가이를 수행 할 수 있습니까?

... 아니면 다른 서비스, 아마도 외부 서비스를 제공 할 수 있습니까?

답변

관련 문제