기존 PDF 파일을 읽으려면 텍스트뿐만 아니라 글꼴 (굵게, 기울임 꼴), 단락, 이미지, 표와 같은 형식 정보도 가져오고 싶습니다. 기본적으로 PDF와 비슷한 HTML을 작성하고 싶습니다.자바를 통해 PDF 읽기 및 HTML 내용 받기
이렇게하는 코드 라이브러리가 있습니까? 오픈 소스 라이브러리를 찾고 있습니다.
감사합니다, 티나 아그라 왈
기존 PDF 파일을 읽으려면 텍스트뿐만 아니라 글꼴 (굵게, 기울임 꼴), 단락, 이미지, 표와 같은 형식 정보도 가져오고 싶습니다. 기본적으로 PDF와 비슷한 HTML을 작성하고 싶습니다.자바를 통해 PDF 읽기 및 HTML 내용 받기
이렇게하는 코드 라이브러리가 있습니까? 오픈 소스 라이브러리를 찾고 있습니다.
감사합니다, 티나 아그라 왈
페이지의 정확한 버전을 원한다면 페이지 이미지를 만들고 그 위에 보이지 않는 텍스트를 입력해야 할 수 있습니다. 우리의 블로그에서 가능한 것의 아이디어를 http://www.jpedal.org/PDFblog/2012/08/4-ways-to-convert-pdf-to-html5/ (PDF에서 HTML로 변환)에서 볼 수 있습니다.
스캔 한 이미지로 만든 PDF는 어떤가요? 텍스트가 포함되어 있습니까? – Ingo
PDF에 모든 텍스트, 이미지 및 표가 포함되어 있습니다. 단어 문서가 PDF로 변환 될 수 있습니다. –