2
나는 Lucene 인덱싱 전에 PDFTextStripper 클래스를 사용하여 pdf 텍스트를 추출합니다.PDFBox로 머리글과 바닥 글이없는 텍스트 추출
추출 된 텍스트에서 pdf 머리글과 바닥 글을 제외시킬 수 있습니까?
나는 Lucene 인덱싱 전에 PDFTextStripper 클래스를 사용하여 pdf 텍스트를 추출합니다.PDFBox로 머리글과 바닥 글이없는 텍스트 추출
추출 된 텍스트에서 pdf 머리글과 바닥 글을 제외시킬 수 있습니까?
머리글과 바닥 글이 문서에서 정확히 어디에 있는지 알고 있으면 영역별로 텍스트 추출을 사용할 수 있습니다. 희망이 도움이됩니다.