2010-02-19 4 views

답변

3

젠드 배경에서 오는 Zend_Search_Lucene을 사용하는 것이 좋습니다. XPDF 예제는 정말 간단하고 단순 해 보입니다. XPDF는 GPL로 라이센스되어 있습니다 - 귀하의 필요에 맞는 것이라면 # 1로 가십시오!

ZF는 Symfony 프로젝트 내에서 쉽게 통합 될 수 있습니다. Twitter Call입니다.

2

PDF에서 텍스트 콘텐츠를 추출하기위한 라이브러리가 많이 있습니다. 그 중 하나를 사용하여 내용으로 lucene 문서를 작성해야합니다. 가장 유용한 것들은 이미 lucene 통합이있는 것입니다.

Apache PDFBox create a lucene 문서를 PDF 파일에서 직접 다운로드 할 수 있습니다. 여기에는 PDF 메타 데이터 필드와 텍스트 내용이 포함됩니다.