pdf2dom을 사용하고 있으며 기본 설명서를 시험하고 있습니다. 그들의 문서에 명시된 - Pdf2Dom은 Apache PDFBox ™ 라이브러리를 기반으로합니다.PDF2DOM을 사용하여 HTML을 PDF로 변환하는 경우 null
File file = new File("file.pdf");
PDDocument pdf = PDDocument.load(file);
PDFDomTree parser = new PDFDomTree();
Document dom = parser.createDOM(pdf);
System.out.println(dom);
인쇄됩니다 무엇 - [#document : 널 (null)]와 같은 코드를 시도
3 가지 PDF의
내가 그것을 유효한 텍스트를 반환 텍스트에서 동일한 PDF를 제거합니다. 따라서 파일이 null이 아닙니다. 틀린 일이나 도서관 자체를하고 있습니까?
스트리퍼 코드가 도움이되는지 확인하십시오.
PDDocument pdf = PDDocument.load(pFile);
PDFTextStripper stripper = new PDFTextStripper();
String text = stripper.getText(pd);
System.out.println(text);
미리 감사드립니다.
감사합니다. 멍청한 탓으로 돌봐 주셔서 감사합니다. –