저는 Symfony 개발자이고 웹 서버는 Linux입니다. 이미 sfLucene 플러그인을 사용하고 있습니다.Lucene을 사용하여 symfony로 PDF 파일 색인 생성
Linux PHP 서버에서 검색 할 수 있도록 PDF 파일을 색인하는 가장 간단한 방법은 무엇입니까?
- XPDF는 SOLR sfLucene plugin branch
- 세 번 째 옵션을 통해 like this
- Apache Tika를 설치?
고마워요!
저는 Symfony 개발자이고 웹 서버는 Linux입니다. 이미 sfLucene 플러그인을 사용하고 있습니다.Lucene을 사용하여 symfony로 PDF 파일 색인 생성
Linux PHP 서버에서 검색 할 수 있도록 PDF 파일을 색인하는 가장 간단한 방법은 무엇입니까?
고마워요!
젠드 배경에서 오는 Zend_Search_Lucene을 사용하는 것이 좋습니다. XPDF 예제는 정말 간단하고 단순 해 보입니다. XPDF는 GPL로 라이센스되어 있습니다 - 귀하의 필요에 맞는 것이라면 # 1로 가십시오!
ZF는 Symfony 프로젝트 내에서 쉽게 통합 될 수 있습니다. Twitter Call입니다.
PDF에서 텍스트 콘텐츠를 추출하기위한 라이브러리가 많이 있습니다. 그 중 하나를 사용하여 내용으로 lucene 문서를 작성해야합니다. 가장 유용한 것들은 이미 lucene 통합이있는 것입니다.
Apache PDFBox create a lucene 문서를 PDF 파일에서 직접 다운로드 할 수 있습니다. 여기에는 PDF 메타 데이터 필드와 텍스트 내용이 포함됩니다.