2012-01-28 2 views
0

doc 또는 docx를 Java의 HTML로 변환하는 방법. 아파치 POI를 사용하여, 나는 doc로 HTML로 변환 할 수 있었지만 docx를 html로 변환 할 수 없었다? 샘플 코드를 보여 주시겠습니까? 이 코드는 doc에서는 작동하지만 docx에서는 작동하지 않습니다.Doc 또는 Docx를 Java의 HTML로 변환

 HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream); 

     WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
       DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument()); 
     wordToHtmlConverter.processDocument(wordDocument); 
     Document htmlDocument = wordToHtmlConverter.getDocument(); 
     ByteArrayOutputStream out = new ByteArrayOutputStream(); 
     DOMSource domSource = new DOMSource(htmlDocument); 
     StreamResult streamResult = new StreamResult(out); 

     TransformerFactory tf = TransformerFactory.newInstance(); 
     Transformer serializer = tf.newTransformer(); 
     serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8"); 
     serializer.setOutputProperty(OutputKeys.INDENT, "yes"); 
     serializer.setOutputProperty(OutputKeys.METHOD, "html"); 
     serializer.transform(domSource, streamResult); 
     out.close(); 

     String result = new String(out.toByteArray()); 
+0

당신은 예를 참조 그것을 위해 docx4j 사용할 수 있습니다 : https://github.com/plutext/docx4j/blob/master/src/samples/docx4j/org/docx4j/samples/ConvertOutHtml.java –

답변

0

이것이 작동하지 않아야하는 이유는 없습니다. 당신은 POI의 최신 버전을 사용하고 있는지 확인, 짧은에서

, 그리고 모든이 있습니다

다음을 검토하십시오 필수 라이브러리.

는 (. 추가 지원이 필요한 경우, 작동하지 않는 것을 설명해 당신은 컴파일 시간 오류를 얻고있다 런타임 오류를 예기치 않은 출력을???)

+0

감사. 귀하의 링크는 docx를 추출하는 방법을 보여 주지만 docx를 html로 변환해야합니다. – user960567

+0

@ user960567 - * .doc을 어떻게 HTML로 변환 했습니까? * .docx로 작업하는 것은 전혀 다르지 않습니다. 무엇을 시도 했습니까? 문제가있는 곳은 어디입니까? – ziesemer

+0

내 편집 된 질문보기 – user960567

관련 문제