pdfbox

    0

    1답변

    PDF를 가장 효율적인 방법으로 HTML로 변환하고 싶습니다. 입력은 기본 64 형식의 pdf이고 출력은 HTML이어야합니다. 좋은 오픈 소스도 있습니다. 아무도 도와 줄 수 있습니까?

    3

    1답변

    나는 pdfbox api 클래스 LucenePDFDocument에 의해 생성 된 색인을 가지고 있습니다. 색인에는 텍스트 내용 만 포함되므로이 색인을 효과적으로 검색하고 싶습니다. 검색 문자열을 사용하여 'contents'필드를 검색 할 것이므로 결과 순서는 관련성이 낮은 것부터 관련성이 낮은 것부터 시작해야합니다. 아래 주어진 코드는 검색된 텍스트의 단어

    0

    1답변

    저는 pdf 전자 책에서 주제 모델링을하고 있으며 단락별로 텍스트 단락을 추출해야합니다. 이것을 위해 나는 PDF에서 텍스트를 효율적으로 추출하는 apache pdfBox를 사용하고 있습니다. PDFParser parser; PDFTextStripper pdfStrip = null; parsedText = pdfStrip.getText (pdDoc); 단락

    3

    1답변

    다음 작업을 수행하고 싶습니다. PDF 파일 세트가 있는데, 먼저 좌표계의 원점을 확인하고 싶습니다. pdf 좌표계의 원점이 왼쪽 위가 아닌 경우 (일반적으로 원점은 왼쪽 하단), 왼쪽 상단에 좌표가있는 결과 PDF를 만들고 싶습니다. PDFBox를 사용하여이 작업을 수행하려고합니다. [코드 스 니펫은 아래에 있습니다.] 그러나 결과 PDF가 공백으로오고

    11

    1답변

    PDFBox를 사용하여 유니 코드 문자를 PDF에 쓰는 데 문제가 있습니다. 다음은 "š"을 출력하는 대신 가비지 문자를 생성하는 샘플 코드입니다. UTF-8 문자열 지원을 위해 추가 할 수있는 항목은 무엇입니까? PDDocument document = new PDDocument(); PDPage page = new PDPage(); document.a

    2

    1답변

    PDFBox를 사용할 서버를위한 작은 프로그램을 작성해야합니다. NetBeans를 사용하여 Windows에서 작성 중입니다. PDFBox 항아리를 서버로 보내면 어떻게 프로그램 항아리에 추가 할 수 있습니까?

    6

    3답변

    나는이 자바 코드가 있습니다 try { PDFTextStripper pdfs = new PDFTextStripper(); String textOfPDF = pdfs.getText(PDDocument.load("doc")); doc.add(new Field(campo.getDestino(), textOfPDF,

    3

    3답변

    보이지 않는 텍스트를 기존 PDF 파일에 삽입하여 검색 가능하게하고 싶습니다. 어떤 라이브러리을 사용해야합니까? API 방법으로 연결되는 링크를 부탁드립니다. 무료이며 이상적으로 오픈 소스입니다. 감사합니다. : 당신은 눈에 보이지 않는 텍스트를 렌더링 할 필요가 없습니다

    2

    2답변

    PDF에서 PDF를 추출하려면 PDFBox를 사용하고 있습니다. PDF는 매우 단순한 테이블 형식의 구조를 가지고 있으며 각 열은 매우 넓습니다. 모든 종류의 가로 공간이 하나의 공백 문자로 변환된다는 것을 제외하고는 실제로 잘 작동합니다. 더 이상 열을 구분할 수 없습니다 (열 사이의 공백은 열 사이의 공백처럼 보입니다). 일반적인 솔루션은 매우 어렵지만

    0

    1답변

    iText 및 PDFBox로 시도했습니다. 간단하지는 않습니다.이를 위해 많은 코드를 이해해야합니다. 누구든지 Java 응용 프로그램을 사용하여 PDF를 읽고 쓰는 간단한 방법을 제공 할 수 있습니까? 응용 프로그램이 독립형이고 웹/응용 프로그램 서버가 필요하지 않은지 확인하십시오.