2010-05-21 1 views
1

기존 PDF 파일을 읽으려면 텍스트뿐만 아니라 글꼴 (굵게, 기울임 꼴), 단락, 이미지, 표와 같은 형식 정보도 가져오고 싶습니다. 기본적으로 PDF와 비슷한 HTML을 작성하고 싶습니다.자바를 통해 PDF 읽기 및 HTML 내용 받기

이렇게하는 코드 라이브러리가 있습니까? 오픈 소스 라이브러리를 찾고 있습니다.

감사합니다, 티나 아그라 왈

+0

스캔 한 이미지로 만든 PDF는 어떤가요? 텍스트가 포함되어 있습니까? – Ingo

+0

PDF에 모든 텍스트, 이미지 및 표가 포함되어 있습니다. 단어 문서가 PDF로 변환 될 수 있습니다. –

답변

3

PDFBox 또는 iText보십시오. 그들은 오픈 소스이며 텍스트, 이미지, 표 등을 처리 할 수 ​​있습니다.