2012-10-25 3 views
3

PDF 문서 (아마도 제목 일 것입니다!)에서 가장 큰 텍스트를 찾을 수있는 프로그램을 작성해야합니다. Tika을 파서로 사용해 보았지만 시도 할 수 없었습니다. 글꼴 크기를 가져 오는 방법을 찾으십시오. 또한 Tika 라이브러리는 너무 강력하고 복잡합니다. 더 쉬운 방법/라이브러리를 사용할 수 있습니까? 라이브러리를 사용하지 않고 PDF를 직접 구문 분석하는 것이 더 쉽거나 더 낫습니다 (필자는이 방법에 다소 관심이 있습니까?). 그렇다면 어디에서 시작해야합니까?자바에서 PDF 파일의 글꼴 크기 분석하기

모든 정보를 매우 높이 평가합니다.

답변

1

this 메서드가 PDFBox 라이브러리의 processTextPosition에서 PDFTextStripper을 무시하고 글꼴 크기를 추출합니다. 게시물의 질문이 조금 다르기 때문에 나는 전에 그것을 보지 못했습니다.