2011-08-15 5 views
0

Quark 8.51로 코딩 된 pdf 파일을 열려고하는데 문제가 있습니다. 문서에서 텍스트를 추출하기 위해 itext를 사용합니다. 그러나 열면 거기에 횡설수설하는 심볼이 많이 있습니다. 무의미한 단어. 누구든지 어떤 제안이 있습니까?itext pdf issue

+0

파일은 http://96-38-234-101.static.gwnt.ga.charter.com/Coates.pdf – Eric

+1

에서 다운로드 할 수 있습니다. 코드를 게시 할 수 있습니까? 당신은 텍스트를 추출하는 데 사용 했습니까? – Milhous

답변

0

IText 메일 링리스트에 질문하거나 jpedal이나 PdfBox와 같은 추출 라이브러리를 사용해 보셨습니까?

0

평범한 텍스트 이외의 텍스트를 읽으 려한다면 제대로 작동하지 않습니다. 문제를 일으킬 수있는 다른 문제는 인코딩입니다.

관련 문제