pdf에서 워드 좌표를 추출하기 위해 (선호하는 Java-) 라이브러리 또는 명령 행 도구를 찾고 있습니다. input-pdfs는 텍스트 또는 ocr-text가 뒤에있는 이미지를 포함합니다.pdf에서 워드 좌표를 추출하는 라이브러리/도구
사용 사례 :
Java 웹 응용 프로그램에서이 기능을 사용하여 강조 표시하고 추가 소프트웨어 (예 : Adobe Reader 등)없이 제공하고 싶습니다. 대신 일치하는 페이지를 이미지로 변환하고 웹 페이지 내에서 표시하려고합니다.
iText를 추출 할 수 있습니다 PDF를 렌더링하지 않습니다. 텍스트와 좌표를 PDF에서 찾을 수 있지만 이미지를 그릴 수는 없습니다. –