2011-08-29 2 views
1

태그가 지정된 PDF 파일에서 태그 트리를 추출하려면 라이브러리 (Linux 바이너리, jar 또는 소스)를 권장 할 수 있습니까? 나는 PDFMiner를 시도했지만, 시도한 첫 번째 파일에서 충돌이 발생했습니다.PDF에서 태그 추출

답변

1

iText를 사용해 보셨습니까? iText를 사용하여 시각적으로이 트리를 보여주는 프로젝트의 예를 보려면 PDFVole을보십시오. 이 appoach를 사용하면 트리 노드를 해당 페이지 컨텐츠와 링크 할 수 없습니다.

+0

유망스럽게 보이지만 발견 된 첫 번째 태그가있는 PDF (www.adobe.com/enterprise/accessibility/pdfs/acro6_pg_ue.pdf) –

+0

은 webstart 버전이었고 독립형 항아리가 멋지게 보입니다 –

관련 문제