2010-12-06 15 views
1

pdf에서 워드 좌표를 추출하기 위해 (선호하는 Java-) 라이브러리 또는 명령 행 도구를 찾고 있습니다. input-pdfs는 텍스트 또는 ocr-text가 뒤에있는 이미지를 포함합니다.pdf에서 워드 좌표를 추출하는 라이브러리/도구

사용 사례 :
Java 웹 응용 프로그램에서이 기능을 사용하여 강조 표시하고 추가 소프트웨어 (예 : Adobe Reader 등)없이 제공하고 싶습니다. 대신 일치하는 페이지를 이미지로 변환하고 웹 페이지 내에서 표시하려고합니다.

+0

iText를 추출 할 수 있습니다 PDF를 렌더링하지 않습니다. 텍스트와 좌표를 PDF에서 찾을 수 있지만 이미지를 그릴 수는 없습니다. –

답변

0

당신은 (http://www.jpedal.org/pdf_thumbnail_tutorials.php) 축소판을 생성하는 JPedal를 사용하여 텍스트 (http://www.jpedal.org/support_egETAW.php)

관련 문제