2012-04-06 2 views
0

Apache POI & docx4j를 사용하여 doc 파일 읽기. 내가 그것에서 데이터를 추출 할 때 그것은 단지 TEXT하지 이미지을 반환Apache POI & docx4j를 사용하여 doc 파일 읽기

이 난 아파치 POI와 docx4j &의 사용과 문서 파일을 읽어했지만 문제입니다. &도 내가없는 새 단락의 표기를 시작하거나 단락이 종료 한 ..

가에 대한 해결책이 ..

답변

0

을에서 나는 당신의 문제는 문서에서 반환 된 데이터는 점이다 읽은 내용 text (string type) 비트 맵에 입력 된 데이터가 문자 배열이기도합니다.

문자 시퀀스를 인식하고이를 비트 맵 확장으로 렌더링하는 파서를 사용하는 것이 좋습니다.

+0

.doc 파일에 이미지가있는 경우에도 "SQUIRE"기호 만 가져옵니다 .... – Wolverine

+0

Java는 imageIO가되는 파일을 읽을 때 여러 가지 방법을 사용합니다. 여기에 샘플이 있습니다. http : //www.exampledepot.com/egs/javax.imageio/BasicImageRead.html – Dennis